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ПРЕДИСЛОВИЕ 


Искусственный интеллект является научным направлением, за- 
дачи которого связаны с разработкой методов моделирования от- 
дельных функций интеллекта человека с помощью программно- 
аппаратных средств ЭВМ. Слово «интеллект» употребляется в раз- 
личных смыслах и, хотя каждый из его обладателей имеет различное 
субъектное мнение, что следует понимать под человеческим интел- 
лектом, можно утверждать, что одним из главных его проявлений яв- 
ляется способность адекватно реагировать на любую, особенно но- 
вую, ситуацию путем корректировки поведения на основе имеющего- 
ся опыта. Однако реализация этого с помощью имеющихся стандарт- 
ных вычислительных методов проблематична или невозможна в 
принципе. Причина этого - свойственный ЭВМ алгоритмический, 
строго детерминированный подход к обработке информации, часто 
ограничивающий ее использование на уровне мощного калькулятора 
с богатыми возможностями визуализации информации при решении 
задач количественного характера. 

В то же время в таких областях, как автоматизация проектиро- 
вания, автоматическое управление, социально-экономические систе- 
мы и др. преобладает информация, представленная наборами фактов, 
гипотез, правил и закономерностей, сформулированных на качест- 
венном уровне. При этом задачи, описанные количественными и ка- 
чественными признаками с преобладанием последних, относятся к 
слабоструктурированным проблемам и их решение основывается 
именно на методах искусственного интеллекта. Среди таких подхо- 
дов, применяемых различными исследователями, можно выделить 
эвристическое программирование, искусственные нейронные сети, 
эволюционное моделирование, нечеткое моделирование, представле- 
ние и обработка знаний и др. В настоящем учебном пособии рассмат- 
риваются эти методы искусственного интеллекта, а также особенно- 
сти их применения при решении ряда практических задач. Знакомст- 
во с ними, с одной стороны, необходимо для становления специали- 
ста в области новых информационных технологий, с другой — позво- 
лит расширить круг пользователей интеллектуального программного 
обеспечения. 
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Учебное пособие состоит из шести глав. 

Первая глава знакомит с основными понятиями искусственного 
интеллекта, а также исторически сложившимися подходами к 
проведению исследований в этом научном направлении. Рассматри- 
ваются возможности, а также области применения искусственного 
интеллекта. 

Вторая глава посвящена методам эвристического программиро- 
вания при решении задач искусственного интеллекта. Рассматривает- 
ся ключевое понятие эвристики, а также его роль при решении по- 
добных задач. Приводятся постановка и принципы решения двух 
главных задач эвристического программирования — поиска в про- 
странстве состояний и пространстве задач. Также глава знакомит с 
особенностями применения принципов эвристического поиска в иг- 
ровых моделях, используемых во многих прикладных областях. 

Третья глава содержит описание моделей представления знаний 
в информационных системах. Особое внимание уделяется классиче- 
ским моделям представления знаний: логической, продукционной, 
фреймовой, на основе семантической сети. Рассматриваются различ- 
ные ситуации, где каждая из моделей может быть использована. 
Здесь также приводятся основы формализации нечеткости в знаниях 
с применением теории нечетких множеств. В заключение главы от- 
мечаются особенности систематизации знаний на основе онтологий. 

Четвертая глава содержит сведения о принципах функциониро- 
вании и разработки искусственных нейронных сетей, позволяющих 
моделировать мыслительные процессы человека. Отмечаются задачи, 
где применение этой технологии наиболее эффективно, отличия в ор- 
ганизации и функционировании нейрокомпьютеров от традиционных 
ЭВМ. Приводится формализация структуры искусственного нейрона, 
а также особенности объединения их в слои и нейронные сети. Осо- 
бое внимание уделяется методам обучения нейронных сетей, аспек- 
там, связанным с повышением эффективности их использования. 
Также рассматриваются модификации моделей нейронных сетей и 
методов их обучения. 

Пятая глава посвящена одному из перспективных направлений в 
области искусственного интеллекта, связанному с моделированием 
эволюционных процессов в различных системах. В частности, благо- 
даря своей эффективности методы эволюционного моделирования 
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получили распространение при решении оптимизационных задач, ха- 
рактеризующихся большой размерностью и сложным для анализа и 
применения традиционных методов пространством поиска. Рассмат- 
риваются такие эволюционные алгоритмы, как генетический алго- 
ритм, генетическое программирование, эволюционное программиро- 
вание, эволюционные стратегии. Приводится описание используемых 
в них структур данных и операторов. 

Шестая глава знакомит с принципами разработки и применения 
экспертных систем. Рассматриваются основные понятия, типовая ст- 
руктура экспертных систем, а также их классификация. Особое вни- 
мание уделяется проектированию экспертных систем на основе веро- 
ятностной модели вывода. Также приводятся особенности создания 
экспертных систем на основе байесовских сетей доверия. Их приме- 
нение позволяет учитывать вероятностные причинно-следственные 
связи между понятиями предметной области и как следствие порож- 
дать более сложные умозаключения. 

Излагаемый материал иллюстрируется примерами. В конце глав 
помещены вопросы для самоконтроля. 
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1. ВВЕДЕНИЕ В ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ 


Искусственный интеллект (ИИ) является одним из приоритет- 
ных направлений в современной информатике, связанным с создани- 
ем следующей ступени ее развития — новых информационных техно- 
логий. Их цель — свести к минимуму участие человека как програм- 
миста при создании информационных систем, но привлекать его в ка- 
честве учителя, партнера человеко-машинной системы. Однако нель- 
зя понимать термин «искусственный интеллект» буквально. Пра- 
вильнее его воспринимать как некоторое метафорическое наименова- 
ние совокупности методов, реализация которых на компьютере по- 
зволяет получать результаты близкие к порождаемым человеческим 
мышлением. 


1.1. Некоторые понятия искусственного интеллекта 


Идея создания искусственного интеллекта связана с постоянным 
стремлением человека переложить решение сложных задач на меха- 
нического, затем электронного помощника. Единственный способ 
реализовать это заключается в моделировании с помощью различных 
средств интеллектуальных способностей человека. 

Здесь под интеллектом следует понимать способность мозга ре- 
шать задачи путем приобретения, запоминания и целенаправленного 
преобразования знаний в процессе обучения на опыте и адаптации к 
разнообразным условиям [6]. 

Искусственный интеллект (Агийс1а! п{еШоепсе, АТ) как научное 
направление существует с 1956 года, когда британский математик 
Алан Тьюринг опубликовал свою статью «Сап ће Масһіпе Так ?» 
(«Может ли машина мыслить ?»). Также он предложил тест проверки 
программы на интеллектуальность. Он состоял в следующем: органи- 
зовывалось «общение» между человеком и компьютерной програм- 
мой, которые размещались в разных комнатах, и до тех пор, пока 
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исследователь не определял, кто за стеной — человек или программа, 
поведение последней считалось интеллектуальным [1]. Исходя из 
этого, Тьюринг предложил следующий критерий интеллектуальности 
программы: «Если поведение вычислительной машины, отвечающей 
на вопросы, невозможно отличить от поведения человека, отвечаю- 
щего на аналогичные вопросы, то она обладает интеллектом». 

В настоящее время существует три основные точки зрения на 
цели и задачи исследований в области искусственного интеллекта 
[1,6]. Согласно первой, исследования в этой области относятся к фун- 
даментальным, в процессе которых разрабатываются новые модели и 
методы решения задач, традиционно считавшихся интеллектуальны- 
ми и не поддававшихся ранее формализации с помощью классиче- 
ских алгоритмических методов, а также автоматизации. Интеллект и 
мышление непосредственно связаны с решением таких задач, как до- 
казательство теорем, логический анализ, распознавание ситуаций, 
планирование поведения, управление в условиях неопределенности и 
т.п. Характерными чертами интеллекта, проявляющимися в процессе 
решения подобных задач, являются способность к обучению, обоб- 
щению, накоплению опыта и адаптации к изменяющимся условиям в 
процессе решения задач. Из-за этих качеств интеллекта мозг может 
решать разнообразные задачи, а также легко перестраиваться с реше- 
ния одной задачи на другую. Таким образом, мозг, наделенный ин- 
теллектом, является универсальным средством решения широкого 
круга задач (в том числе плохо формализованных), для которых нет 
стандартных, заранее известных методов решения. Согласно второй 
точке зрения, это направление связано с новыми идеями решения за- 
дач на ЭВМ, с разработкой новых технологий программирования и с 
переходом к компьютерам с отличной от фон-неймановской архитек- 
турой. Так, в качестве основы для таких систем предлагаются раз- 
личные подходы на основе искусственный нейронных сетей, модели- 
рующих наиболее общие принципы работы головного мозга [5]. Для 
таких моделей характерны легкое распараллеливание алгоритмов и 
связанная с эти высокая производительность, а также возможность 
работать даже при условии неполной информации об окружающей 
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среде. Третья точка зрения основана на том, что в результате иссле- 
дований, проводимых в области ИИ, появляется множество приклад- 
ных систем, способных решать задачи, для которых ранее создавае- 
мые системы были непригодны. 

Обобщая изложенное, будем определять искусственный интел- 
лект как научное направление, задачи которого связаны с разработ- 
кой методов моделирования отдельных функций интеллекта человека 
с помощью программно-аппаратных средств ЭВМ. 

Исторически сложились три основных подхода к проведению 
исследований в области искусственного интеллекта. 

Первый подход (машинный интеллект) в качестве объекта ис- 
следования рассматривает именно искусственный интеллект и состо- 
ит в моделировании внешних проявлений интеллектуальной деятель- 
ности человека с помощью средств ЭВМ. В основе его лежит тезис о 
том, что машина Тьюринга является теоретической моделью мозга, 
поэтому главное направление работ связано с созданием алгоритми- 
ческого и программного обеспечения ЭВМ, позволяющих решать ин- 
теллектуальные задачи не хуже человека. Примером может служить 
шахматная программа, проявление интеллектуальности которой со- 
стоит в поиске игровой тактики, близкой к человеческой. Однако 
достигается это исключительно путем высокой скорости вычислений, 
в то время как у человека - благодаря высокоэффективному 
мышлению. 

Как известно, человеческий мозг оперирует непрерывной ин- 
формацией, где каждая мысль существует только внутри своего кон- 
текста. Знания хранятся в форме образов, которые часто трудно выра- 
зить словами. При этом сами образы характеризуются нечеткостью и 
размытостью, а обработка информации - небольшой глубиной и вы- 
соким параллелизмом. Все это свидетельствует о существенном раз- 
личии с принципами машины Тьюринга и как следствие требует дру- 
гого некомпьютерного подхода к моделированию интеллектуальных 
процессов. 

Второй подход (искусственный разум) рассматривает данные о 
нейрофизиологических и психологических механизмах интеллекту- 
альной деятельности и разумного поведения человека. Он стремится 
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воспроизвести эти механизмы с помощью программно-аппаратных 
средств. Развитие этого направления тесно связано с успехами наук о 
человеке, в первую очередь нейронаук (нейробиологии, генетики и 
т). 

Третий подход ориентирован на создание смешанных человеко- 
машинных интеллектуальных систем как симбиоз возможностей ес- 
тественного и искусственного интеллекта. Важнейшими проблемами 
в этих исследованиях являются оптимальное распределение функций 
между естественным и искусственным интеллектом, организация 
диалога между человека и машиной. 

Каждое из отмеченных направлений включает целый ряд разде- 
лов, к основным из которых можно отнести разработку систем, осно- 
ванных на знаниях, анализ естественного языка и общения с ЭВМ, 
распознавание образом, анализ речи, создание адаптивных систем, 
игры и машинное творчество и др. [1]. В свою очередь, реализация 
подобных систем может быть выполнена на основе таких технологий 
ИИ, как представление и обработка знаний, эвристическое програм- 
мирование, искусственные нейронные сети, эволюционные алгорит- 
мы, нечеткие множества и др. 

К настоящему времени разработано целое множество про- 
граммный систем, в которых реализованы те или иные технологии 
ИИ. Такие системы принято называть интеллектуальными системами. 
К первой из подобных систем относят программу «Логик-Теоретик» 
(А. Ньюэлл, А. Тьюринг и др.), предназначенную для доказательства 
теорем исчисления высказываний. 

Под интеллектуальной системой будем понимать адаптивную 
систему, позволяющую строить программы целенаправленной дея- 
тельности по решению поставленных перед ними задач на основании 
конкретной ситуации, складывающейся на данный момент в окру- 
жающей их среде [9]. В свою очередь, адаптивная система может 
быть охарактеризована как система, которая сохраняет работоспо- 
собность при непредвиденных изменениях свойств управляемого 
объекта, целей управления или окружающей среды путем смены ал- 
горитма функционирования, программы поведения или поиска опти- 
мальных, в некоторых случаях просто эффективных, решений и 
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состояний. Традиционно, по способу адаптации различают самона- 
страивающиеся, самообучающиеся и самоорганизующиеся системы. 

К сфере решаемых интеллектуальными системами задач отно- 
сятся задачи, обладающие, как правило, следующими особенностями: 

- неизвестен или не может быть реализован алгоритм решения; 

- если существует алгоритмическое решение, но его нельзя ис- 
пользовать из-за ограниченности ресурсов (время, память); 

- задача не может быть сформулирована в числовой форме; 

- цель нельзя выразить в терминах точно определенной целевой 
функции. 

Разработка интеллектуальных систем, как правило, ведется в 
рамках одного или нескольких направлений ИИ, которых в настоя- 
щее время существует целое множество. Ниже кратко рассматрива- 
ются основные из них [1]. 


1.2. Основные направления исследований в области 
искусственного интеллекта 


Разработка систем, основанных на знаниях. Является одним 
из главных направлений в искусственном интеллекте. Основной це- 
лью создания таких систем является выявление, исследование и при- 
менение знаний специалистов для решения различных практических 
задач. Обычно такие знания формализуются в виде некоторой систе- 
мы правил. В этой области исследований осуществляется разработка 
моделей извлечения, представления и структуризации знаний с уче- 
том их компьютеризации в виде базы знаний. Примеры практических 
разработок подобных систем обычно ассоциируются с экспертными 
системами. 

Разработка систем общения на естественном языке и ма- 
шинного перевода. Является наиболее важной с точки зрения пере- 
хода на новый качественный уровень взаимодействия с компьюте- 
ром. Попытки создания подобных систем предпринимались с 1950-х 
годов 20 в. Основу систем машинного перевода составляет 
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классификация грамматических правил и приемов использования 
словаря. Однако для обработки сложного разговорного текста необ- 
ходимы алгоритмы анализа его смысла, создание которых очень тру- 
доемкая и пока нерешенная задача. Поэтому в настоящее время дос- 
тупны системы, обеспечивающие диалог между человеком и компью- 
тером на упрощенном, урезанном естественном языке, программы 
электронного перевода эффективные преимущественно при работе с 
односложным текстом, а также функции ассоциативного контекстно- 
го поиска в электронных словарях. 

Разработка интеллектуальных систем на основе принципов 
обучения, самоорганизации и эволюции. Моделирование этих 
принципов ориентировано на исследование возможностей решения 
задач с помощью законов функционирования наиболее свойственных 
биологическим системам. Процесс обучения связан со способностью 
системы накапливать информацию и рационально корректировать в 
соответствии с ней свое поведение. Самоорганизация подразумевает 
способность системы обобщать накопленную информацию, например 
для поиска в ней закономерностей. Использование принципов эволю- 
ции позволяет системе приобретать новые качества и свойства для 
наиболее оптимального функционирования. 

Распознавание образов. Является одним из ранних направле- 
ний искусственного интеллекта. Оно связано с моделированием осо- 
бенностей восприятия внешнего мира, узнавания объектов. В основе 
этого лежит тот факт, что все объекты могут быть проклассифициро- 
ваны по определенным признакам и, следовательно, умение разли- 
чать их проявление и позволяет идентифицировать соответствующий 
объект. 

Игры и машинное творчество. Машинное творчество охваты- 
вает сочинение компьютерной музыки, стихов, автоматизацию изо- 
бретения новых объектов. Компьютерные игры являются той сферой 
искусственного интеллекта, которая наиболее знакома большинству 
пользователей. Уровень реализации ИИ в игре во многом определяет 
ее интересность, поэтому разработчики компьютерных игр постоянно 
совершенствуют их интеллектуальную составляющую. 
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Программное обеспечение систем искусственного 
интеллекта. Инструментальные средства для разработки интеллек- 
туальных систем включают специальные языки программирования, 
представления знаний, среды создания систем ИИ, а также оболочки 
экспертных систем. 

Интеллектуальные роботы. Их создание связано с объедине- 
нием технологий искусственного интеллекта и методов кибернетики, 
робототехники. В настоящее время их производство ограничивается 
манипуляторами с жесткой схемой управления, а также роботами 
развлекательного и бытового назначения с узкой областью примене- 
ния и ограниченными функциями. Сдерживающим фактором при 
разработке более совершенных кибернетических систем являются не- 
решенные проблемы в области машинного зрения, адаптивного пове- 
дения, накопления и обработки трехмерной визуальной информации. 

Уровень теоретических исследований по искусственному интел- 
лекту в России не уступает мировому. Началом становления этого 
научного направления в нашей стране следует считать 1954 г., когда в 
МГУ начал свою работу семинар «Автоматы и мышление» под руко- 
водством академика Ляпунова А.А. Впоследствии стали активно раз- 
виваться направления, связанные с представлением и обработкой 
знаний, ситуационным управлением, моделированием рассуждений, 
распознаванием образов, обработкой естественного языка [3]. 

Развитие искусственного интеллекта в современной России свя- 
зано с образованием в 1988 г. Ассоциации искусственного интеллек- 
та, объединившей научные школы, исследователей по различным на- 
правлениям ИИ. Под ее эгидой проводятся различные исследования, 
организуются семинары для специалистов, устраиваются конферен- 
ции, издается научный журнал. 

В то же время проведение прикладных исследований, внедрение 
их результатов в коммерческие разработки происходит гораздо мед- 
леннее, чем за рубежом. Во многом это объясняется консервативно- 
стью потенциальных потребителей новых информационных техноло- 
гий, а также настороженным отношением к возможностям искусст- 
венного интеллекта. 

Далее рассматриваются основные методы научного направления 
«Искусственный интеллект», особенности их реализации, а также за- 
дачи, для которых их применение наиболее эффективно. 


13 
Контрольные вопросы 


1. Какой смысл вкладывается в понятие «искусственный 
интеллект»? 

2. Решением каких задач занимается научное направление ис- 
кусственный интеллект? 

3. Какие существуют подходы к исследованиям в области ис- 
кусственного интеллекта? 

4. Что такое интеллектуальная система? 

5. В каких областях применение интеллектуальных систем 
наиболее эффективно? 

6. Какие существуют основные направления исследований в 
области искусственного интеллекта? 

7. Подготовьте реферат, посвященный истории развития искус- 
ственного интеллекта в России и за рубежом. 
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2. МЕТОДЫ ЭВРИСТИЧЕСКОГО 
ПРОГРАММИРОВАНИЯ 


Эвристическое программирование — разработка стратегий дей- 
ствий на основе заранее заданных эвристик (теоретически необосно- 
ванных правил). Эвристический метод - метод решения задачи, осно- 
ванный на интуиции решающего лица. Этот метод часто не имеет 
формального доказательства того, что он приводит к цели. 

В основе методов эвристического программирования лежит по- 
нятие эвристики, которое может рассматриваться, с одной стороны, 
как информация, отражающая специфику задачи, с другой – как не- 
которое предположение о способе разрешения проблемы на основе 
имеющегося опыта решения подобных задач. Сам процесс эвристиче- 
ского программирования можно рассматривать как построение неко- 
торого плана действий (планирование решения) с применением эври- 
стик. Часто эвристическое программирование используется в задачах 
большой размерности, где решение в принципе может быть найдено 
перебором. 


2.1. Направления эвристического программирования 


Эвристическое программирование имеет двоякую цель: 

- выяснение сущности естественного интеллекта; 

- использование машинного интеллекта для решения сложных 
задач. 

Эвристическое программирование охватывает несколько на- 
правлений, связанных с планированием решения задач ИИ (рис. 2.1) 

Все задачи, связанные с построением плана действий, можно 
разбить на два типа [11]: 

- планирование в пространстве состояний; 

- планирование в пространстве задач. 
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Эвристическое программирование 


Аа 


Эвристический поиск в Эвристический поиск в 
пространстве состояний пространстве задач 
Игровые модели Общий решатель задач (СР$) 


искусственного интеллекта 


НЕЕ: 


Планирование решения задач в 
системах искусственного интеллекта 


Прикладная 
область 


Автоматизация инженерного творчества 
(поисковое конструирование) 


Рис. 2.1. Направления эвристического программирования 


В первом случае считается заданным некоторое пространство 
ситуаций (состояний), требуется найти путь, ведущий из начального 
состояний в одно из конечных. 

Второй тип задач состоит в поиске декомпозиции исходной за- 
дачи на подзадачи посредством введения между ними отношений 
«часть-целое», «задача-подзадача», «общее-частное» и т.п., что в ре- 
зультате приводит к задачам, решение которых известно. 

В основе решения перечисленных типов задач лежит тот или 
иной метод эвристического поиска. 


2.2. Эвристический поиск в пространстве состояний 


Типичным представителем класса задач, для которых подходит 
представление (формализация) в пространстве состояний, является 
головоломка, известная как игра в пятнадцать. В ней используется 
пятнадцать пронумерованных (начиная с 1) подвижных фишек, рас- 
положенных в клетках квадрата 4х4. Одна клетка этого квадрата ос- 
тается всегда пустой. Передвигая соседние с ней фишки необходимо 
добиться упорядоченного расположения их номеров. На рис. 2.2 изо- 
бражены две конфигурации фишек для игры в пятнадцать (а) и для ее 
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упрощенного варианта - квадрата 3х3 и восьми фишек (6). Рассмот- 
рим задачу перевода начальной (первой) конфигурации в целевую 
(вторую) конфигурацию. Решением этой задачи будет подходящая 
последовательность сдвигов фишек, например: «передвинуть фишку 
8 вверх, фишку 6 влево и т.д.». 


6) 


Рис. 2.2. Пример перехода между состояниями игры 


Основными особенностями класса задач, к которому принадле- 
жит рассмотренная головоломка, является наличие в каждой задаче 
точно определенной начальной ситуации и точно определенной цели. 
Имеется также некоторое множество операций или ходов, переводя- 
щих одну ситуацию в другую. Именно из таких ходов состоит иско- 
мое решение задачи, которое можно получить (теоретически) мето- 
дом проб и ошибок. Действительно, отправляясь от начальной ситуа- 
ции, можно построить все промежуточные конфигурации, возникаю- 
щие в результате выполнения каждого из возможных ходов, затем 
построить множество конфигураций после применения следующего 
хода и так далее — пока не будет достигнута целевая конфигурация. 


2.2.1. Представление задачи в виде пространства состояний 


Ключевым понятием при формализации задачи в пространстве 
состояний является понятие состояния, характеризующего некоторый 
момент решения задачи. Так, для игры в пятнадцать состояние — это 
просто некоторая конкретная конфигурация фишек. Среди всех со- 
стояний выделяются начальное состояние и целевое состояние (целе- 
вая конфигурация), в совокупности определяющие задачу, которую 
надо решить. 

Другим важным понятием для рассматриваемого представления 
является понятие оператора, или допустимого хода в задаче. Опера- 
тор преобразует одно состояние в другое, являясь, по сути, функцией, 
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определенной на множестве состояний и принимающей значения из 
этого множества. Для рассматриваемой игры удобнее выделить четы- 
ре оператора, соответствующие перемещениям пустой клетки влево, 
вправо, вверх, вниз. В некоторых случаях оператор может оказаться 
неприменимым к какому-то состоянию: например, операторы вправо 
и вниз неприменимы, если пустая клетка расположена в правом ниж- 
нем углу (соответствующая функция является частично определен- 
НОЙ). 

В терминах состояний и операторов решение задачи есть опре- 
деленная последовательность операторов, преобразующая начальное 
состояние в целевое. Решение задачи ищется в пространстве состоя- 
ний — множестве состояний, достижимых из начального состояния 
при помощи операторов. В игре в пятнадцать пространство состояний 
состоит из всех конфигураций фишек, которые могут быть образова- 
ны в результате допустимых перемещений фишек. 

Таким образом задача эвристического поиска содержательно 
может быть представлена в следующем виде [11]. Заданы начальная 
ситуация (объект, состояние), конечная ситуация и множество опера- 
торов, преобразующих одну ситуацию в другую. Требуется найти та- 
кую последовательность операторов, которая преобразует начальную 
ситуацию в конечную наилучшим образом. Математически данная 
задача описывается с помощью четырех множеств < 5,5, Е, Г >, где 

5 — множество состояний; 

90 С 5 - множество начальных состояний; 


Т с $ - множество конечных состояний; 

Е – множество операторов. 

Метод решения задачи < 5,5, Е,Г > называется методом эври- 
стического поиска, если он на каждом шаге находит все возможные 
применения операторов к данному текущему состоянию, а порядок 
рассмотрения состояний и порядок применения операторов управля- 
ется свойствами уже рассмотренных до этого шага состояний. 


2.2.2. Представление пространства состояний 
Пространство состояний можно представить в виде графа, вер- 


шины которого соответствуют состояниям, а дуги — применяемым 
операторам. Тогда решение задачи — это путь, ведущий от начального 
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состояния к целевому. На рис. 2.3 показана часть пространства со- 
стояний для игры в пятнадцать, в каждой вершине помещена та кон- 
фигурация фишек, которую она представляет. Пространства состоя- 
ний могут быть большими и даже бесконечными, но в любом случае 
предполагаются конечность множества допустимых операторов и ко- 
нечность множества возможных состояний. 

Итак, формализация задачи с использованием пространства со- 
стояний включает выявление и определение следующих составляю- 
ЩИХ: 

- формы описания состояний и описание исходной задачи; 

- множество операторов и их воздействий на описания состоя- 
НИЙ; 

- указание свойств целевых состояний. 

Эти составляющие задают (неявно) пространство, в котором 
требуется провести поиск решения задачи. 


09| 4 [15 
(з 2) 
[58 [6 
[03] 2 [1014 


пе [4+ [15] [95| [194115] [191415 
(шз (121 |134 [12|] [113121] [138112 
ав] [7151816] [586] |715 шо 
132 о[14] [921014] — [13121104] (1312 оа 
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Рис. 2.3. Фрагмент пространства состояний для игры в пятнадцать 


Ясно, что решение задачи, представленной описанным спосо- 
бом, можно в принципе обнаружить, осуществляя последовательный 
поиск или перебор вершин в пространстве состояний. В начале этого 
процесса к начальному состоянию применяется тот или иной опера- 
тор. Затем на каждом шаге поиска к одному из уже полученных 
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(просмотренных) состояний применяется допустимый оператор и 
строится новая вершина. Поиск заканчивается, когда построено целе- 
вое состояние. 

Математически пространство состояний может быть представ- 
лено как граф С(Х, Е), где Х = {хо,х,...,х, 1} - множество (в общем 
случае бесконечное) вершин графа, каждая из которых отождествля- 
ется с одним из состояний 525; 

Е = (хх, )|хьх, Е Х,х, Е Е(х,}} - множество дуг или ребер графа 
бесконечное, если бесконечно множество Х. Все ребра в графе явля- 
ются взвешенными, т.е. им присвоено некоторое значение (вес), по- 
зволяющее оценить с помощью оценочной функции ф(х) переход от 
одного состояния к другому; 

Е(х) — преобразование, порождающее все дочерние вершины 
от Хх. 

| Е(х) | - количество дочерних вершин от х, т.е. вершин, соеди- 
ненных с х дугой. 

Структура графа пространства состояний представляется в виде 
матрицы весов (значений оценочной функции) графа: ИТ, ;], 
і=01,2,...,п-1, в которой у; ; соответствует значение веса ребра 
(х;,х;) или 0, если вершины х,, х; не связаны ребром (х;,х;). 

Если граф пространства состояний не является простым, то он 
должен быть преобразован в него посредством исключения всех пе- 
тель и заменой каждого множества параллельных ребер кратчайшим 
ребром (ребром с наименьшим весом) из этого множества, каждое 
неориентированное ребро заменяется парой ориентированных. 

В множестве вершин Х выделяют подмножество вершин 
Хос ‚, соответствующее множеству начальных состояний $ с 5 и 
Х, с Х ‚ соответствующих множеству конечных состояний Т с 5. 

Определим путь в графе С как г = (х1,х...х 1), где (хх. ЕЕ, 
1=1,2,...к-1. 

Если хє Ху, х; є Х,, то решение задачи эвристического поиска 
в пространстве состояний сводится к задаче поиска пути г на графе 
С. Сумма всех ребер в пути называется весом или длиной пути. 
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Рассмотрим еще один пример представления задачи в простран- 
стве состояний, а именно задачу о коммивояжере. В ней коммивоя- 
жер, располагая картой дорог между несколькими городами, должен 
выстроить кратчайший маршрут своей поездки так, чтобы побывать в 
каждом городе, но не более одного раза. На рис. 2.4 показана карта 
дорог между 7 городами. 


А с 


: 
=> - 
8: 
Рис. 2.4. Пример задачи о коммивояжере 


Для этой задачи фрагмент пространства состояний, представ- 
ленного деревом, приведен на рис. 2.5. 


(А) 


(АВСНРЕ) 


(АВСНрЕС) 
*АВСНОЕСА) 


Рис. 2.5. Фрагмент пространства состояний для задачи о коммивояжере 


Таким образом, алгоритм поиска решения этой задачи заключа- 
ется в построении дерева пространства состояний посредством пере- 
бора его вершин до тех пор, пока не будет обнаружена целевая вер- 
шина. При этом эффективность решение будет зависеть от такого 
важного параметра, как максимальная глубина дерева. 

Вершины и указатели, построенные в процессе перебора, обра- 
зуют поддерево всего неявно определенного пространства состояний. 
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Будем называть такое поддерево деревом перебора. 

Известные алгоритмы поиска в пространстве состояний разли- 
чаются несколькими характеристиками [1]: 

- использованием или нет эвристической информации; 

- порядком раскрытия (обхода) вершин; 

- полнотой просмотра пространства; 

- направлением поиска. 

В соответствии с первой характеристикой алгоритмы делятся на 
два класса — слепые и эвристические. В слепых алгоритмах поиска в 
пространстве состояний местонахождение целевой вершины никак не 
влияет на порядок, в котором рассматриваются (раскрываются) вер- 
шины. В противоположность им эвристические алгоритмы (методы) 
используют (для уменьшения возникающего перебора) априорную 
(эвристическую) информацию о том, где в пространстве состояний 
расположена цель, поэтому для раскрытия обычно выбирается более 
перспективная вершина. 

Два основных вида слепых алгоритмов поиска, различающихся 
порядком раскрытия вершин, — это алгоритмы поиска (перебора) 
вширь и поиска (перебора) вглубь. Как слепые, так и эвристические 
алгоритмы могут отличаться полнотой просмотра пространства со- 
стояний. 

Полные алгоритмы перебора при необходимости осуществляют 
полный просмотр пространства. В отличие от них, неполные алго- 
ритмы реализуют просмотр лишь некоторой части пространства, и 
если искомая целевая вершина не находится в этой части, то решение 
этим алгоритмом не будет найдено. 

В соответствии с направлением поиска алгоритмы можно разде- 
лить на прямые (поиск ведется от начальной вершины к целевой), об- 
ратные (поиск от целевой вершины в направлении к начальной) и 
двунаправленные (чередование прямого и обратного поиска, или же 
одновременное их проведение). Наиболее употребительными (отчас- 
ти, из-за их простоты) являются прямые алгоритмы. 


2.2.3. Алгоритмы слепого перебора 


Двумя основными разновидностями слепого перебора являются 
алгоритмы перебора в ширину и в глубину. 
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В алгоритме перебора в ширину вершины раскрываются (пере- 
бираются) в том порядке, в котором они строятся. На рис. 2.6 приве- 
дено дерево, полученное в результате применения алгоритма поиска в 
ширину для некоторой начальной конфигурации игры в восемь, при- 
чем алгоритм работает только до глубины 4. В вершинах дерева по- 
мещены соответствующие описания состояний, они занумерованы в 
том порядке, в котором были раскрыты. 


Рис. 2.6. Пример дерева, построенного алгоритмом поиска в ширину 


Алгоритм перебора в ширину состоит из следующей последова- 
тельности шагов. 

1. Поместить начальную вершину в список нераскрытых вершин 
Ореп. 

2. Если список Ореп пуст, то окончание алгоритма и выдача со- 
общения о неудаче поиска в противном случае - переход к следую- 
щему шагу. 

3. Выбрать первую вершину из списка Ореп (назовем ее Сштепі) 
и перенести ее в список С]о$е4. 

4. Раскрыть вершину Сштепф, образовав все ее дочерние верши- 
ны. Если дочерних вершин нет, то перейти к шагу 2, иначе поместить 
все дочерние вершины (в любом порядке) в конец списка Ореп и по- 
строить указатели, ведущие от этих вершин к родительской вершине 
Сштепї. 

5. Проверить, нет ли среди дочерних вершин целевых. Если есть 
хотя бы одна целевая вершина, то закончить алгоритм и выдать 
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решение задачи в виде последовательности указателей от найденной 
целевой вершины к начальной. В противном случае перейти к шагу 2. 

Можно показать, что при переборе вширь непременно будет 
найден самый короткий путь к целевой вершине, при условии, что 
этот путь вообще существует. Если же такого пути нет, то будет со- 
общено о неуспехе поиска в случае конечных графов, а в случае бес- 
конечных графов алгоритм никогда не кончит свою работу. 

Глубину вершины в дереве можно определить следующим обра- 
зом: 

- глубина корня дерева равна нулю; 

- глубина каждой некорневой вершины равна глубине ее роди- 
тельской вершины плюс единица. 

В алгоритме перебора в глубину прежде всего раскрываются те 
вершины, которые были построены последними, то есть имеющие 
наибольшую глубину. 

Основные шагами алгоритма перебора в глубину являются сле- 
дующие. 

1. Поместить начальную вершину в список Ореп. 

2. Если список Ореп пуст, то закончить алгоритм и выдать со- 
общение о неудаче поиска, в противном случае перейти к следующе- 
му шагу. 

3. Выбрать первую вершину из списка Ореп (назовем ее Сштепі) 
и перенести ее в список С]о$е4. 

4. Если глубина вершины Сигтеи равна граничной глубине, то 
перейти к шагу 2, в ином случае перейти к следующему шагу. 

5. Раскрыть вершину Сштепї, построив все ее дочерние верши- 
ны. Если дочерних вершин нет, то перейти к шагу 2, иначе поместить 
все дочерние вершины (в произвольном порядке) в начало списка 
Ореп и построить указатели, ведущие от этих вершин к родительской 
вершине Сштепії. 

6. Если среди дочерних есть хотя бы одна целевая вершина, то 
закончить алгоритм и выдать решение задачи в виде последователь- 
ности указателей от найденной целевой вершины к начальной. В про- 
тивном случае перейти к шагу 2. 
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На рис. 2.7 показано дерево, построенное алгоритмом поиска в 
глубину, граничная глубина установлена равной 4. Вершины зануме- 
рованы в том порядке, в котором они были раскрыты. В качестве на- 
чального состояния взята та же самая конфигурация игры в восемь, 
что и в примере на рис. 2.6. В обоих этих деревьях построено одина- 
ковое количество вершин, но порядок их раскрытия различается. 
Видно, что в алгоритме поиска в глубину сначала идет поиск вдоль 
одного пути, пока не будет достигнута максимальная глубина, затем 
рассматриваются альтернативные пути той же или меньшей глубины, 
которые отличаются от него лишь последним шагом, после чего рас- 
сматриваются пути, отличающиеся последними двумя шагами, и т.д. 


Рис. 2.7. Пример дерева, построенного алгоритмом поиска в глубину 


При бесконечном пространстве состояний перебор в глубину 
может привести к бесконечному процессу поиска, если он пошел по 
ветви дерева, не содержащей целевого состояния. Поэтому необхо- 
димо ограничение этого процесса, например за счет ограничения 
максимальной глубины просмотра дерева. Это означает, что в ходе 
перебора раскрываются только вершины с глубиной, не превышаю- 
щей некоторую заданную граничную глубину, т.е. в первую очередь 
раскрытию подлежит вершина наибольшей глубины, но не превы- 
шающей эту границу. Соответствующий алгоритм поиска называется 
ограниченным перебором в глубину. 

Если сравнивать алгоритмы поиска в ширину и в глубину, то 
последний, несмотря на свою неполноту, может оказаться предпочти- 
тельнее: если он начат с удачной стороны, то целевая вершина будет 
обнаружена раньше, чем в алгоритме поиска в ширину. 
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Если перебор осуществляется на графах, а не на деревьях, необ- 
ходимо внести некоторые очевидные изменения в указанные алго- 
ритмы. В алгоритме полного перебора следует дополнительно прове- 
рять, не находится ли уже вновь построенная вершина в списках Ореп 
и СІоѕеа по той причине, что она уже строилась раньше в результате 
раскрытия какой-то вершины. Если это так, то такую вершину не 
нужно снова помещать в список Ореп. В алгоритме же поиска в глу- 
бину, кроме рассмотренного изменения, может оказаться необходи- 
мым пересчет глубины порождающейся вершины, уже имеющейся 
либо в списке Ореп, либо в списке СІоѕей. 

В целом алгоритмы слепого перебора являются неэффективны- 
ми методами поиска решения, приводящими в случае нетривиальных 
задач к проблеме комбинаторной сложности. Действительно, если І. — 
длина решающего пути, а В – количество ветвей (дочерних вершин) у 
каждой вершины, то для нахождения решения надо исследовать В" 
путей, ведущих из начальной вершины. Величина эта растет экспо- 
ненциально с ростом длины решающего пути, что приводит к ситуа- 
ции, называемой комбинаторным взрывом. 

Таким образом, для повышения эффективности поиска необхо- 
димо использовать информацию, отражающую специфику решаемой 
задачи и позволяющую более целенаправленно двигаться к цели. Та- 
кая информация обычно называется эвристической, а соответствую- 
щие алгоритмы -— эвристическими. 


2.2.4. Эвристический поиск 


Идея, лежащая в основе большинства эвристических алгорит- 
мов, состоит в том, чтобы оценивать перспективность нераскрытых 
вершин пространства состояний и выбирать для продолжения поиска 
наиболее перспективную вершину. 

Для этого используется эвристическая оценочная функция. Эта 
функция определяется на множестве вершин пространства состояний 
и принимает числовые значения, которые могут интерпретироваться 
как перспектива раскрытия вершины или вероятность ее расположе- 
ния на решающем пути. Использование такой функции позволяет 
сделать поиск упорядоченным. 
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Рассмотрим основные шаги алгоритма эвристического поиска. 

Пусть имеются: одна начальная вершина ху Е Ху; 

5 — множество уже выбранных вершин; 5 - множество вершин — 
кандидатов в $, при этом 5 (| 5 =0; 

Х, - множество конечных вершин; 

х — текущая вершина; 

х; - дочерняя вершина х. 

Тогда алгоритм поиска в графе пространства состояний заклю- 
чается в поиске пути, начиная из вершины ху, просматривая граф в 
ширину и представляется следующими шагами. 

1. Поместить хо в 8 и вычислить оценочную функцию ф(хо). 


2. Выбрать такую хє $, что ф(х) = тіп(ф(у)) и поместить ее в 5, 
ує$ 


изъяв из 5. При равенстве выбрать любую. 

3. Если хє Х, - путь найден, иначе продолжить. 

4. Найти все х; є Е(х), если Е(х)=0, то перейти к шагу 2, иначе 
вычислить все ф(х;). 

5. Для каждого х;: 

а) если х, #5175, то поместить х; в 5; 

б) если хеЕЕ (х) П5, то сопоставить х, наименьшее из старой и 
вновь полученной оценки ф(х;); 

в) если х; є Ё(х)[|5 , то сопоставить х, наименьшее из старой и 
вновь полученной оценки ф(х;), поместить х; в 5 (изъяв ее из 5); 

г) в остальных случаях не изменять $ и 5. 

6. Перейти к шагу 2. 

Пункты 5(6), 5(в) отражают действие алгоритма, когда оператор 
Е порождает уже рассмотренные вершины, которые к этому моменту 
находятся в 5 или 5, поэтому этим вершинам приписываются наи- 
меньшие из возможных оценочных функций. 

На рис. 2.8 показано дерево игры в восемь, построенного алго- 
ритмом эвристического перебора с указанной оценочной функцией. 
Оценка каждой вершины приведена рядом с ней внутри кружка. От- 
дельно стоящие цифры показывают порядок, в котором раскрывались 
вершины. 


Рис. 2.8. Пример дерева эвристического поиска 


Рассмотрим процесс построения дерева поиска пути на основе 
изложенного ранее алгоритма. Результаты поиска будем представлять 
в виде двух множеств 5 и 5, содержащих вершины с указанием в 
скобках значений весов входящих в них дуг. В качестве оценочной 
функции будем использовать следующую: ф(х) = Р(х) + К(х), где 

Р(х) – глубина вершины х или число ребер дерева на пути от 
этой вершины к начальной; 

К(х) – число фишек позиции — вершины х, лежащих не на «сво- 
ем» месте. 

Будем считать, что меньшее значение ф(х) соответствует более 
перспективной вершине, и вершины раскрываются в порядке увели- 
чения (возрастания) значения оценочной функции. 


5 = 4х0(4)3; 
5 = 11(6), х2(6), хз (4)}. 
Вершины м, х, х; являются дочерними для вершины ху. Вер- 
шина х; имеет наименьшее значение оценочной функции, поэтому 
она исключается из 5 и добавляется в 5. 
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5 = 4х0 (4), хз (4)}; 
"5 = (1(6), (6), х4 (5), х5 (6), (5)}. 
Новые вершины в 5 есть дочерние для последней добавленной 
вершины. Вершины х4, х, имеют одинаковую минимальную оценку, 


выберем из них любую и добавим в 5. 
5 = {х0(4), (4), х(5)3; 


оо. (5),%5 (6), хо(5), 10(7)}. 
д 5 бо), 

5 = {1 (6), хо (6), х4 (5), х5(6), хо (7), 2 1(5}}. 
$ 5 0,4), (5) (5) 109) 


5 = {1 (6), х› (6), х4(5),х5 (6), хо (7), м (7), 12 (5)}. 

6. 5 = {хо (4), хз (4), х (5), хо (5), хи (5), м2(5)}. 

Последняя вершина, добавленная в 5 х, єТ7, следовательно, 
путь найден: ху —> хз = х6 — Хо = Хр = р. 

В ходе решения задачи может возникнуть ситуация, когда при 
выборе вершин для множества 5 совпадают их оценочные функции, в 
этом случае необходимо проанализировать всевозможные альтерна- 
тивные пути, начиная с данного этапа. 

Найденный путь решения задачи длиною в пять ходов может 
быть получен и другими методами перебора, но использование оце- 
ночной функции приводит к существенно меньшему числу раскрытий 
вершин. Действительно, сравнение трех алгоритмов перебора пока- 
зывает, что в среднем алгоритм эвристического поиска обнаруживает 
решение быстрее алгоритмов слепого перебора. Важно однако, что 
использование эвристической функции не может гарантировать со- 
кращение поиска во всех случаях и иногда (хотя и редко) решение за- 
дачи может искаться дольше, чем с использованием слепого метода. 

Ясно, что подбор «хорошей» эвристической функции (сущест- 
венно сокращающей поиск) наиболее трудный момент при формали- 
зации задачи, особенно это важно в больших пространствах состоя- 
ний. Можно сравнивать различные оценочные функции для одной 
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задачи по их эвристической силе, т.е. по тому, насколько они сокра- 
щают (ускоряют) поиск. 


2.2.5. Алгоритм поиска пути на графе 


В ряде случаев при наличии графа, описывающего полное про- 
странство состояний и динамически изменяющейся игровой ситуа- 
ции, возникает задача поиска за минимальное время короткого пути, 
ведущего из начальной ситуации хо в одно из конечных х,. Для ее 
решения существует несколько алгоритмов, один из которых состоит 
в следующем. 

Рассматриваемый алгоритм определяет расстояние между вер- 
шинами в простом орграфе с неотрицательными весами. Алгоритм, 
начиная из вершины хо, просматривает граф в ширину, помечая вер- 
шины х; значениями — метками их расстояний от хо. Временная мет- 


ка вершины х; - это минимальное расстояние от хо до х;, когда в 


определении пути на графе учитываются не все маршруты из хо в х,. 


Окончательная метка х; содержит минимальное расстояние на графе 


от Хо до х;. Таким образом, в каждый момент времени работы алго- 
ритма некоторые вершины будут иметь окончательные метки, а ос- 
тальная их часть — временные. Алгоритм заканчивается, когда вер- 
шина х, получает окончательную метку, то есть расстояние от Хо до 
и 

Вначале вершине хо присваивается окончательная метка 0 (ну- 
левое расстояние до самой себя), а каждой из остальных | Х | - 1 вер- 
шин присваивается временная метка % (бесконечность). На каждом 
шаге алгоритма одной вершине с временной меткой присваивается 
окончательная и поиск продолжается дальше. На каждом шаге вер- 
шины меняются следующим образом. 

1. Если имеется дуга из х; в х,, то каждой вершине х;, не 
имеющей окончательной метки, присваивается новая временная мет- 
ка — наименьшая из ее временной и числа (у; ; окончательная метка 


х;), где х; - вершина, которой присвоена окончательная метка на пре- 
дыдущем шаге. 
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2. Определяется наименьшая из всех временных меток, которая 
становится окончательной меткой своей вершины, в случае равенства 
меток выбирается любая из них. 

Циклический процесс п.1, п.2 продолжается до тех пор, пока 
вершина х; не получит окончательной метки, которая представляет 
собой короткий путь от этой вершины до начала ху. 

Рассмотрим работу представленного выше алгоритма для графа, 


заданного в виде матрицы весов графа (табл. 2.1). 
Таблица 2.1 
Матрица весов графа 


У хо ХІ Х2 ХЗ Х4 Х5 Хб 
хо 0 7 2 0 0 0 0 
ХІ 0 0 0 1 5 0 10 
Х2 0 Э 0 5 0 0 0 
ХЗ 0 0 0 0 Б 7 0 
Х4 0 0 8 0 0 5 2 
Х5 0 0 0 0 5 0 6 
Хб 0 0 0 0 0 0 0 


Граф со структурой, соответствующей данной матрице пред- 
ставлен на рис. 2.9. 


Хб 
10 
Х1 
хи ь 6 
7 
Хо 2 Х2 5 Хз 7 Х5 


Рис. 2.9. Граф для демонстрации работы алгоритма 


Процесс назначения меток вершинам графа на каждом шаге 
представлен в табл. 2.2. 
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Таблица 2.2 
Процесс работы алгоритма 
Шаг ХО ХІ х2 ХЗ Х4 Х5 хі 
0 0 Ве. 8 со со со со со 
1 7 2 со со со со 
2 О! б 
3 6 10 о 15 
4 9 13 15 
5 И 


Квадратами выделены окончательные метки. Путь перемещения 
от х, к хо отмечен в таблице ломаной кривой через вершины 
Хо —> № > > 23 > хц ә Хх и его длина равна 11 (рис. 2.10). 


С 


Хо 2 Х2 5 Хз 7 Х5 
Рис. 2.10. Представление найденного пути на графе примера 


Далее приводится алгоритм для создания компьютерной про- 


граммы поиска пути на графе. 
Рог ХЕХ ао 


Ведіп 
Магк [х] = ЕАІЅЕ; 
ріѕі [х] = ®; 
Епа; 
у р. 
Магк [х0] = ТВОЕ; 


різі [х0] 


|| 
е) 
<. 
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Мһі1е по Магк[хї] ао 
Ведіп 
Гог ХЕХ ао 
ТЕ поё Магк|[х] апа ріѕі[х]>ріѕі [у] + [у, хі] Еһеп 
Ведіп 
ра Ег ріеЕТу Т Гуи Т 
Ргеу [х]=у; 
Епа; 
{Поиск новой вершины уєХ с минимальной временной 


меткой} 
ріѕі [у] = міп(ріѕё[х]); {хє Х апа Магк|[х]=ЕАІЅЕ} 
Магк [у] = ТВОЕ; 
Епа. 


В приведенном алгоритме граф представляется матрицей весов 
Ұ. Вектор Магк[х] меток вершин устанавливает принадлежность 
вершины хє Х постоянной (ТВОЕ) или временной (ЕАТ8Е) метке. 
Вектор 01$ в алгоритме фиксирует текущие значения вершин. Вектор 
Ргеу позволяет восстановить в обратной последовательности верши- 
ны найденного пути. Ргеу[х| указывает на вершину с окончательной 
меткой, ближайшую к вершине х. Последовательность вершин окон- 
чательного пути будет иметь следующий вид: хі, Ргеу[хі], 
Ргеу[Ргеу[х{|], Ргеу[Ргеу[Ргеу[х{]]], ... , х0, а значение 01$ х{| соста- 
вит длину пути из х0 в хі. Очередная новая вершина, претендующая 
на постоянную метку, обозначается через у. 


2.3. Эвристический поиск в пространстве задач 


Эвристический поиск в пространстве задач сводится к нахожде- 
нию доказательства того, что решение данной задачи выводится из 
решения совокупности ее подзадач. Решение будет получено тогда, 
когда множество подзадач будут полностью состоять из заведомо 
разрешимых задач (аксиом) или будет доказано, что исходная задача 
не имеет решения. 

На рис. 2.11 представлен пример задачи Т в виде И/ИЛИ дерева. 
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м м 
а 


Рис. 2.11. Представление пространства подзадач 


Задача Т может быть решена, если решены подзадачи А, В или 
С, О. В свою очередь задача А решаема, если достижима вершина р. 
Задача В - если Е, Е или С, а задача С, если решаема подзадача С. 
Подзадачи О, Е, Е, С называются разрешимыми. 

Существует несколько различных методов эвристического по- 
иска в пространстве задач, например универсальный решатель задач 
ОР5, предложенный Ньюэллом и др. в 1960 г. 

В основе работы СРЅ лежит метод «анализа целей и средств», 
согласно которому для достижения каждой подцели выбирается опе- 
ратор, уменьшающий различие между имеющимся и желаемым со- 
стоянием объекта. При этом изначально должны быть заданы опера- 
торы, различия, таблица связей, а также цель (супер цель) и объекты, 
участвующие в задаче [11]. 

В ОР5 используется четыре вида целей: 

- преобразование А в объект В; 

- уменьшение различия О между объектами А и В; 

- применение оператора О к объекту А; 

- выбор из множества $ элемента, наилучшим образом удовле- 
творяющего критерию С. 

Работа метода ОРЗ заключается в циклическом поиске способа 
уменьшить различие между текущим состоянием объекта и заданной 
целью, посредством рекурсивной генерации из существующих новых 
подцелей (рис. 2.12). 

Каждой из подцели ставится в соответствие свой метод или опе- 
ратор ее достижения. Если же на некотором шаге работы СРЗ невоз- 
можно применить такой оператор, то вырабатывается новая подцель 

уменьшить различие (между исходным состоянием объекта и 
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желаемым), препятствующее применению оператора. Для определе- 
ния операторов, наилучшим образом подходящих для уменьшения 
каждого различия, используется таблица связей. Информация, необ- 
ходимая для сравнения объектов, как правило, включается в про- 


грамму, реализующую ОРЪ. 


Успех Нет 


Сравнить АсВ О Подцель: Подцель: Успех 
и найти уменьшить преобразование 
различие р Да различие О А’вВ 
Неудача 
ИХ Проверка Подцель: 
оператора # + Ровер Е А’ 
пригодного для применимости применение " 
уменьшения О Да оператора? оператора { к А спех 
Неудача Неудача Неудача 
Поиск различия Не Е 
О’ между Аи пчеле. А’ | А’ 
уменьшить применение 
и азличие О’ оператора? к А’ 
применения + р Да р Успех 
Нет Неудача Неудача 


Рис. 2.12. Обобщенная схема работы ОРЗ 


Возможности СРЅ были исследованы на примере решения цело- 
го ряда задач, среди которых наиболее известны, такие как задача 
интегрирования, задача «Ханойская башня», задача «о семи Ке- 
нигсбергских мостах» и др. 


2.4. Игровая модель эвристического поиска 


Игры имеют очень большое значение при исследовании искус- 
ственного интеллекта. Игры представляют собой простые проблем- 
ные среды для изучения и испытания процедур эвристического поис- 
ка. В доказательство можно привести следующий тезис. Ведь никто 
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не спорит, что человек думает, когда играет. И если человек играет с 
компьютером, то можно говорить о такой способности применитель- 
но к машине. 

Игры удобны тем, что известны правила и всегда можно опре- 
делить, хорошо человек или машины играет или плохо. Кроме того, 
игры имеют сходство с реальными проблемами, и методы, разрабо- 
танные для решения простых игровых задач, могут быть распростра- 
нены и на более трудные, например поисковое конструирование и ав- 
томатизацию решения изобретательских задач. 

В теории игр для каждой игры характерны следующие особен- 
ности [1]. 

1. Должно быть как минимум два игрока. 

2. Игроки поочередно делают ходы, пытаясь максимизировать 
свой выигрыш. 

3. Варианты ходов, делаемых игроками, могут быть как извест- 
ны, так и не известны другим игрокам. 

4. Существуют критерии окончания игры и определения побе- 
дителей. 

5. Существует мера выигрыша — некая выплата в условных оч- 
ках, баллах или деньгах. 

В зависимости от п.3 игры бывают с полной информацией 
(шахматы, шашки, го, крестики — нолики, реверси и т.д.) и с неполной 
информацией (большинство карточных игр). Критерий полноты ин- 
формации — знание всех ходов противника, которые произошли ранее 
или могут быть сделаны в настоящий момент (в карточных играх иг- 
рок не видит карты противника, в то время как в шахматах игрок ви- 
дит всю доску и все возможные ходы). 


2.4.1. Структура игровой модели 


Игровая модель представляет собой комбинацию следующих 
элементов: 

- дерево игры: граф С = (Х, Е); 

- порождающие процедуры Р(х); 

- критерий окончания игры (хє Х,); 

- оценочная функция ф(х); 

- процедуры оценки и выбора хода. 
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Дерево игры 
Весь процесс игры можно представить в виде дерева, узлы кото- 
рого служат состояниями, а ребра ходами. На рис. 2.13 приведено де- 
рево игры для двух игроков МАХ и МП\У. 


а? 
ИЛИ - вершина Р - уровень 0 
Ж шш ре пп с 
И - вершина Р) ФУ уровень 1 
С Л. ан - уровень 2 


ГЕЯ - уровень 3 


Хх тіп 
Рис. 2.13. Пример дерева игры для двух игроков 


Надпись в узле обозначает отдельного игрока, имеющего право 
хода в данной ситуации. Позиции А, №, - приемники позиции Р. 
Также различают уровни позиции. Цель построения дерева игры за- 
ключается в определении выигрышной стратегии для одного из игро- 


ков (в нашем случае это игрок ХХ"), отправляясь от некоторой фик- 
сированной конфигурации (позиции) игры (не обязательно началь- 
ной) независимо от ответов противника. 

Для этого могут быть применены разные алгоритмы поиска на 
И/ИЛИ - графах. Решающее дерево заканчивается на позициях, вы- 
игрышных для конкретного игрока, и содержит полную стратегию 
достижения им выигрыша: для каждого возможного продолжения иг- 
ры, выбранного противником, в дереве есть ответный ход, приводя- 
щий к победе. Лист дерева соответствует состояниям игры, в которых 
она заканчивается ничьей, проигрышем или выигрышем одного из 
игроков. 

Заметим, что для конфигураций, где ход принадлежит игроку 
МАХ, в игровом дереве получается ИЛИ - вершина, а для позиций, в 
которых ходит игрок, МПМ - И - вершина. 


Порождающие процедуры 
Задача порождающих процедур состоит в формировании дерева 
игры, то есть генерация приемников для каждой позиции. В общем 
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случае процесс формирования дерева - это упорядоченный перебор 
возможных конфигураций игры. Используется два типа перебора: в 
ширину и в глубину. 

На рис. 2.14 приведено дерево игры двух игроков, полученное в 
результате применения алгоритма перебора в ширину. Уровень глу- 
бины равен четырем. Вершины занумерованы в порядке их 
генерации. 


тах 
я < - уровень 1 
ХЗ р Хх: Же“ - уровень 2 
тіп тіп тіп тіп - уровень 3 
Хх 7 А 8 Хх 9 А 10 


Рис. 2.14. Пример дерева игры, построенного перебором в ширину 


На рис. 2.15 показано дерево игры, построенное алгоритмом пе- 
ребора в глубину. Граничная глубина равна четырем. Вершины зану- 
мерованы в том порядке, в котором они были раскрыты. 


тах 
Ар" = - уровень 1 
ны м и” д” - уровень 2 
Хх а Хх а х ера - уровень З 


Рис. 2.15 Пример дерева игры, построенного перебором в глубину 


Перечисленные алгоритмы перебора имеют как достоинства, так 
и недостатки по сравнению друг с другом. Главным требованием их 
применения является ограничение глубины перебора, в противном 
случае алгоритм никогда не закончит свою работу. Действительно, в 
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большинстве игр (шахматы, шашки) невозможно построить полное 
дерево. Так, в шашках общее число вершин оценивается как 10°. 

Критерии окончания игры 

Предназначены для указания прекращения перебора возможных 
конфигураций игры. Среди них можно выделить следующие: 

- задание значения максимальной глубины; 

- мертвая позиция, например в шахматах это позиция, в которой 
невозможны немедленный ход, взятие фигуры, шах. 

Значение максимальной глубины может быть как статическим, 
так и динамическим. Его выбор может выполняться, например, путем 
ограничения времени хода игрока. 


Оценочная функция 

Назначение оценочной функции заключается в определении 
достоинства игровой позиции. Вычисление оценочной функции по- 
зволяет дать эвристическую оценку шансов на выигрыш одного из 
игроков. 

Оценочная функция, как правило, является статической и чаще 
всего принимает линейную форму ф(х) = су + оу +... +С, у, 

где у; — признак позиции, то есть параметр, характеризующий 
развитие игры; 

с; – вес соответствующего признака у;. 

Например, в шашках ф(х) = 6 + 4т +и, 

где К – перевес в дамках; 

т — перевес в шашках; 

и – перевес в подвижности. 

Значения 6, 4, | соответствуют весам признаков. 

Выбор оценочной функции, а также глубина перебора являются 
одними из главных факторов, определяющих алгоритм игры. 

Выбор или создание хорошей оценочной функции является не- 
обходимым, но не достаточным условием создания эффективной иг- 
ровой модели с точки зрения интеллектуализации игрового процесса. 
Важным моментом здесь является подбор алгоритма или процедуры 
оценки позиций для выбора следующего хода компьютерным про- 
тивником. При этом большинство алгоритмов игр двух игроков с 
полной информацией и нулевой суммой выигрышей базируется на 
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общих идеях минимаксного поиска, а также совершенствующих его 
различных модификаций. 


2.4.2. Алгоритмы оценки игровых ситуаций и выбора хода 


Рассмотрим, к примеру, игру «крестики-нолики» на квадрате 
3х3. Игрок МАХ ходит первым и ставит крестики, а МПМ - нолики. 
Игра заканчивается, когда составлена либо строка, либо столбец, ли- 
бо диагональ из крестиков (выигрывает МАХ) или ноликов (выигры- 
вает МГУ). Оценим размер полного дерева игры: начальная вершина 
имеет 9 дочерних вершин, каждая из которых в свою очередь -— 8 до- 
черних, каждая вершина глубины 2 имеет 7 дочерних и т.д. Таким 
образом, число концевых вершин в дереве игры равно 9!=362880, но 
многие пути в этом дереве обрываются раньше на заключительных 
вершинах. Значит, в этой игре возможен полный просмотр дерева и 
нахождение выигрышной стратегии. Однако ситуация изменится при 
существенном увеличении размеров квадрата или в случае неограни- 
ченного поля игры. 

В таких случаях, как и во всех сложных играх, вместо нереаль- 
ной задачи поиска полной игровой стратегии решается, как правило, 
более простая задача — поиск для заданной позиции игры достаточно 
хорошего первого хода. 

С целью поиска достаточно хорошего первого хода просматри- 
вается обычно часть игрового дерева, построенного от заданной кон- 
фигурации. Для этого применяется один из один из рассмотренных 
алгоритмов. 

После построения таким образом частичного дерева игры вер- 
шины в нем оцениваются, и по этим оценкам определяется наилуч- 
ший ход от заданной игровой конфигурации. При этом для получения 
оценок концевых вершин (листьев) полученного дерева используется 
статическая оценочная функция, а для оценивания остальных вершин 
— корневой (начальной) и промежуточных (между корневой и конце- 
выми вершинами) — используется так называемый минимаксный 
принцип. 

Будем придерживаться общепринятого соглашения, по которо- 
му значение статической оценочной функции тем больше, чем 
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больше преимуществ имеет игрок МАХ (над игроком МГУ) в оцени- 
ваемой позиции. Очень часто оценочная функция выбирается сле- 
дующим образом: 

- статическая оценочная функция положительна в игровых кон- 
фигурациях, где игрок МАХ имеет преимущества; 

- статическая оценочная функция отрицательна в конфигураци- 
ях, где МИМ имеет преимущества; 

- статическая оценочная функция близка к нулю в позициях, не 
дающих преимущества ни одному из игроков. 

Подчеркнем, что с помощью оценочной функции оцениваются 
только концевые вершины дерева игры, для оценок же промежуточ- 
ных вершин (и начальной вершины) используется минимаксный 
принцип, основанный на следующей идее. Если бы игроку МАХ 
пришлось бы выбирать один из нескольких возможных ходов, то он 
выбрал бы наиболее сильный ход, т.е. ход, приводящий к позиции с 
наибольшей оценкой. Аналогично, если бы игроку МІХ пришлось бы 
выбирать ход, то он выбрал бы ход, приводящий к позиции с наи- 
меньшей оценкой. 

Сформулируем теперь сам минимаксный принцип: 

- ИЛИ-вершине дерева игры приписывается оценка, равная мак- 
симуму оценок ее дочерних вершин; 

- И-вершине игрового дерева приписывается оценка, равная ми- 
нимуму оценок ее дочерних вершин. 

Минимаксный принцип положен в основу минимаксной проце- 
дуры, предназначенной для определения наилучшего (достаточно хо- 
рошего) хода игрока исходя из заданной конфигурации игры 3 при 
фиксированной глубине поиска М в игровом дереве [6]. Предполага- 
ется, что игрок МАХ ходит первым (начальная вершина есть ИЛИ- 
вершина). Основные этапы этой процедуры таковы: 

1. Дерево игры строится (просматривается) одним из известных 
алгоритмов перебора (как правило, алгоритмом поиска в глубину) от 
исходной позиции $ до глубины М. 

2. Все концевые вершины полученного дерева, то есть вершины, 
находящиеся на глубине М, оцениваются с помощью статической 
оценочной функции. 
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3. В соответствии с минимаксным принципом вычисляются 
оценки всех остальных вершин: сначала вычисляются оценки вер- 
шин, родительских для концевых, затем родительских для этих роди- 
тельских вершин и так далее; таким образом оценивание вершин 
происходит при движении снизу вверх по дереву поиска — до тех пор, 
пока не будут оценены вершины, дочерние для начальной вершины, 
т.е. для исходной конфигурации $. 

4. Среди вершин, дочерних к начальной, выбирается вершина с 
наибольшей оценкой: ход, который к ней ведет, и есть искомый наи- 
лучший ход в игровой конфигурации $. 

Отмеченные этапы могут быть представлены в виде следующего 
алгоритма. 


Еопсїіоп М1п1Мах (п): Яопор1е; 
{Возвращает 9} 
редіп 
1Е п = 1еаЕ еп {п - концевая вершина} 
геїикп еха1 (п) { возвращает исход игры} 
е1 зе 
1Е п = пах їһеп {п - пах вершина} 
редіп 
9: = - =; {- ® - очень малое отрицательное число} 
ото асна а 9 
мһііе с #1 ао {до тех пор, пока есть потомки } 
редіп 
9:= пах (9, МіпіМах (с)); 
с:= пехіргоіћһег (с); 
епа; 
епа 
е1ѕе {п - тіп вершина} 
редіп 
{+ о – очень большое положительное число} 
Ч о у 


оо аваа (а) 
мате е ЧО 


редіп 
9:= тір (а, МіпімМах (с)); 
с:= пехіргоіћһег (с); 
епа; 
епа; 


тесип 
епа; 
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Данный алгоритм возвращает минимаксное значение корня — 
исход игры, если оба игрока будут играть наилучшим образом. Если 
вершина п — концевая (лист), то функция еуа!() возвращает исход иг- 
ры. В противном случае значение узла будет либо максимумом среди 
значений его потомков, либо минимумом. 

На рис. 2.16 показано применение минимаксной процедуры для 
дерева игры, построенного до глубины М = 3. Концевые вершины не 
имеют имен, они обозначены своими оценками — значениями стати- 
ческой оценочной функции. Числовые индексы имен остальных вер- 
шин показывают порядок, в котором эти вершины строились алго- 
ритмом перебора в глубину. Рядом с этими вершинами находятся их 
минимаксные оценки, полученные при движении в обратном (по от- 
ношению к построению дерева) направлении. Таким образом, наи- 
лучший ход — первый из двух возможных. 


Хот (3) 
(3) Хи т (0) 
(3) ыы (5) Х х (3) ИЕ (0) С са 


гъа 


Рис. 0 е. минимаксной процедуры для дерева игры 


На рассматриваемом игровом дереве выделена ветвь (последо- 
вательность ходов игроков), представляющая так называемую мини- 
максно-оптимальную игру (или основной вариант игры), при которой 
каждый из игроков всегда выбирает наилучший для себя ход. Заме- 
тим, что оценки всех вершин этой ветви дерева совпадают, и оценка 
начальной вершины равна оценке концевой вершины этой ветви. 

В принципе оценочную функцию можно было бы применить и к 
промежуточным вершинам, и на основе этих оценок выбрать наи- 
лучший первый ход, например сразу выбрать ход, максимизирующий 
значение оценочной функции среди вершин, дочерних к исходной. 
Однако считается, что оценки, полученные с помощью минимаксной 
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процедуры, есть более надежные меры относительного достоинства 
промежуточных вершин, чем оценки, полученные прямым примене- 
нием оценочной функции. Действительно, минимаксные оценки ос- 
нованы на просмотре игры вперед и учитывают разные особенности, 
которые могут возникнуть в последующем, в то время как простое 
применение оценочной функции учитывает лишь статические свой- 
ства позиции как таковой. Это отличие статических и минимаксных 
оценок существенно для «активных», динамичных позиций игры (на- 
пример, в шашках и шахматах к ним относятся конфигурации, в ко- 
торых возникает угроза взятия одной или нескольких фигур). При так 
называемых «пассивных», спокойных позициях статическая оценка 
обычно мало отличается от оценки по минимаксному принципу. 

Рассмотрим еще один пример игры, для которой используется 
минимаксная процедура. 

Два игрока (Мах и Мп) играют в следующую игру. Имеется три 
кучки камней, содержащих соответственно 2, 3 и 4 камня. За один 
ход разрешается или удвоить количество камней в какой-нибудь куч- 
ке, или добавить по два камня в каждую из трех кучек. Предполагает- 
ся, что у каждого игрока имеется неограниченный запас камней. 

Выигрывает тот игрок, после чьего хода в какой-нибудь кучке 
становится >15 камней или во всех трех кучках суммарно становится 
>25 камней. Игроки ходят по очереди. 

Определим выигрышную стратегию игры для первого игрока 
Мах. Для этого построим дерево игры (рис. 2.17). 

Представленное на рисунке дерево игры построено методом пе- 
ребора в глубину до уровня 3. В качестве оценочной функции ис- 
пользовалось максимальное значение камней среди всех кучек, зна- 
чение «+оо» соответствует выигрышу игрока Мах, «-®» - игрока 
Мш. Каждая вершина дерева имеет значение оценочной функции 
(вверху) и порядок раскрытия (внизу). 

Следуя принципу минимакса можно определить лучший ход для 
игрока Мах. Этот ход [2, 3, 4] -> [4, 5 ,6], поскольку при любом вари- 
анте хода игрока Мір игрок Мах выигрывает. 
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Таким образом, для определения выигрышного хода первого игрока 
пришлось перебрать все вершины до установленной глубины. Такой 
подход является наиболее простым и гарантирующим определение 
лучшего хода. Однако его вычислительная эффективность сильно за- 
висит от значения глубины дерева и если оно большое, то использо- 
вание минимаксной процедуры может стать затруднительным с точки 
зрения времени. 

В качестве примера рассмотрим фрагмент дерева игры «крести- 
ки - нолики» с правом выбора хода игроком МАХ (рис. 2.18). 

Статическая оценочная функция для этой игры имеет вид: 

+ оо , если Р — позиция выигрыша игрока МАХ; 

- оо, если Р — позиция выигрыша игрока МП\У; 

(Мах + Мах + утех) (ут + ут үп) _ в остальных случаях; 

Мр, М, Мр" - соответственно число строк, столбцов и диа- 
гоналей открытых для игрока МАХ (то есть где он еще может поста- 
вить выигрышные три крестика подряд). 

М" № ут _ аналогичные числа для игрока МІМ. 


х ох |+ 
ге) О МАХ 
Хх 0 


х |о|х |+ © х|о|х х|о|х 
охо о о о о ММ 
х 1 х |х 2 х х |6 


хро х |о|х |+ 50 хо! х 1% х|о|х |+ % 

о о о о ге! ге! ге! ге! МАХ 

И З Х ХО |4 хе хо х| 8 
хо хп х|о|х |+ ® 
охо охо ММ 
хх ОБ хохо 


Рис. 2.18. Фрагмент дерева игры «крестики - нолики» 
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На рис 2.18 представлен фрагмент дерева игры, каждая вершина 
которого имеет оценку и порядок раскрытия. Оценка листьев дерева 
вычисляется оценочной функцией, остальные вершины — на основе 
принципа минимакса. Таким образом возможны три варианта разви- 
тия игры для игрока МАХ. Только один из них является выигрыш- 
ным. 

Допустим, дерево имеет коэффициент ветвления б и глубину 4. 
Минимаксный алгоритм делает обход всего дерева и его сложность 
равна О(Ь°), что не является эффективным. Как видно из рис.2.18, 
следующий выигрышный ход для игрока МАХ мог быть получен без 
просмотра всего дерева. Однако минимаксная процедура организова- 
на таким образом, что процесс построения частичного дерева игры 
отделен от процесса оценивания вершин. 

Такое разделение приводит к тому, что в целом минимаксная 
процедура — неэффективная стратегия поиска хорошего первого хода. 
Чтобы сделать процедуру более экономной, необходимо вычислять 
статические оценки концевых вершин и минимаксные оценки проме- 
жуточных вершин одновременно с построением игрового дерева. 
Этот путь приводит к так называемой альфа-бета процедуре поиска 
наилучшего первого хода от заданной позиции, на нем можно до- 
биться существенного сокращения вычислительных затрат, прежде 
всего времени вычисления оценок. В основе такого сокращения по- 
иска лежит достаточно очевидное соображение: если есть два вариан- 
та хода одного игрока, то худший в ряде случаев можем сразу отбро- 
сить, не выясняя, насколько в точности он хуже. 

Рассмотрим сначала идею работы альфа-бета процедуры на 
примере игрового дерева, приведенного на рис. 2.16. Дерево игры 
строится до глубины №3 алгоритмом перебора в глубину. Причем 
сразу, как это становится возможным, вычисляются не только стати- 
ческие оценки концевых вершин, но и предварительные минимакс- 
ные оценки промежуточных вершин. Предварительная оценка опре- 
деляется соответственно как минимум или максимум уже известных 
(к настоящему моменту) оценок дочерних вершин, и она может быть 
получена при наличии оценки хотя бы одной дочерней вершины. 
Предварительные оценки затем постепенно уточняются по 
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минимаксному принципу — по мере получения новых (предваритель- 
ных и точных) оценок в ходе дальнейшего построения дерева. 
Пусть таким образом построены вершины Х"", Х и первые 
три конечные вершины (рис. 2.19). Эти листья оценены статической 


шах 


функцией, и оши Х› получила точную минимаксную оценку 3, 


а вершина Ху" — предварительную оценку 3. Далее при построении 
и раскрытии вершины Хз“” статическая оценка первой ее дочерней 
вершины дает величину 4, которая становится предварительной 
оценкой самой вершин Хз“. Эта предварительная оценка будет по- 
том (после построения второй дочерней вершины) пересчитана, при- 
чем согласно минимаксному принципу она может только увеличиться 
(так как равна максимуму оценок дочерних вершин), но даже если 
она увеличится, это не повлияет на оценку вершины Хү" , поскольку 
последняя при уточнении по минимаксному принципу может только 
уменьшаться (она равна минимуму оценок дочерних вершин). Следо- 
вательно, можно пренебречь второй дочерней вершиной (равна 5) для 
Ху“, не строить и не оценивать ее (так как уточнение оценки вер- 
шины Хз“ не повлияет на оценку вершины Х|"). Такое сокраще- 
ние процедуры поиска в дереве называется отсечением ветвей дерева. 


Хо шах ( 3) 
(3) 96 тіп е (3) 
и (4) С тах (3) х ре `` 
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Рис.2.19. сЕ а: процедуры для дерева игры 


Продолжим для нашего примера процесс поиска в глубину с од- 
новременным вычислением предварительных (и точных, где это воз- 


можно) оценок вершин вплоть до момента, когда построены уже 


тіп 


вершины Х 1", Хз“ и две дочерних последней, которые оценивают- 


ся статической функцией. Исходя из оценки первой дочерней 
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вершины начальная вершина Ху“, соответствующая исходной пози- 
ции игры, к этому моменту уже предварительно оценена величиной 3. 
Вершина Хз“ получила точную минимаксную оценку 3, а ее роди- 


тельская Х 1" получила пока только предварительную оценку 3. Эта 


предварительная оценка вершины Х 1" может быть уточнена в даль- 


нейшем, но в соответствии с минимаксным принципом возможно 
только ее уменьшение, а это уменьшение не повлияет на оценку вер- 
шины Хо“, поскольку последняя, опять же согласно минимаксному 
принципу, может только увеличиваться. Таким образом, построение 
дерева можно прервать ниже вершины Х/" ‚ отсекая целиком выхо- 
дящие из нее вторую и третью ветви и оставляя ее оценку предвари- 
тельной. 

На этом построение рассматриваемого игрового дерева заканчи- 
вается, полученный результат — лучший первый ход — тот же самый, 
что и при минимаксной процедуре. У некоторых вершин дерева оста- 
лась не уточненная, предварительная оценка, однако этих прибли- 
женных оценок оказалось достаточно для того, чтобы определить 
точную минимаксную оценку начальной вершины и наилучший пер- 
вый ход. В то же время произошло существенное сокращение поиска: 
вместо 17 вершин построено только 11, и вместо 10 обращений к ста- 
тической оценочной функции понадобилось всего 6. 

Обобщим рассмотренную идею сокращения перебора. Для этого 
сформулируем правила вычисления оценок вершин дерева игры, в 
том числе предварительных оценок промежуточных вершин, которые 
назовем альфа- и бета - величинами. 

1. Концевая вершина дерева оценивается статической оценоч- 
ной функцией сразу, как только она построена. 

2 Промежуточная вершина предварительно оценивается по ми- 
нимаксному принципу, как только стала известна оценка хотя бы од- 
ной из ее дочерних вершин, при этом каждая предварительная оценка 
пересчитывается (уточняется) всякий раз, когда получена оценка еще 
одной дочерней вершины. 

3. Предварительная оценка ИЛИ-вершины (альфа-величина) по- 
лагается равной наибольшей из вычисленных к текущему моменту 
оценок ее дочерних вершин. 
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4. Предварительная оценка И-вершины (бета-величина) полага- 
ется равной наименьшей из вычисленных к текущему моменту оце- 
нок ее дочерних вершин. 

Следствием из этих правил является то, что альфа-величины не 
могут уменьшаться, а бета-величины не могут увеличиваться. 

Сформулируем теперь правила прерывания перебора, или отсе- 
чения ветвей игрового дерева. 

1. Перебор можно прервать ниже любой И-вершины, бета- 
величина которой не больше, чем альфа-величина одной из предше- 
ствующих ей ИЛИ-вершин (включая корневую вершину дерева). 

2. Перебор можно прервать ниже любой ИЛИ-вершины, альфа- 
величина которой не меньше, чем бета-величина одной из предшест- 
вующих ей И-вершин. 

При этом в случае 1 говорят, что имеет место альфа-отсечение 
(поскольку отсекаются ветви дерева, начиная с ИЛИ-вершин, кото- 
рым приписана альфа-величина), а в случае 2 — бета-отсечение (по- 
скольку отсекаются ветви, начинающиеся с бета-величин). 

Важно, что рассмотренные правила работают в ходе построения 
игрового дерева вглубь. Это означает, что предварительные оценки 
промежуточных вершин появляются лишь по мере продвижения от 
концевых вершин дерева вверх к корню и реально отсечения могут 
начаться только после того, как получена хотя бы одна точная мини- 
максная оценка промежуточной вершины. 

В рассмотренном примере на рис. 2.19 первое прерывание пере- 
бора было альфа -отсечением, а второе — бета-отсечением. Причем в 
обоих случаях отсечение было неглубоким, поскольку необходимая 
для соблюдения соответствующего правила отсечения предваритель- 
ная оценка (альфа- или бета-величина) находилась в непосредственно 
предшествующей (к точке отсечения) вершине. В общем же случае 
она может находиться существенно выше отсекаемой ветви — на пути 
от вершины, ниже которой производится отсечение, к начальной 
вершине, включая последнюю. 

После прерывания перебора предварительные оценки вершин в 
точках отсечения остаются неуточненными, но, как уже отмечалось, 
это не препятствует правильному нахождению предварительных 
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оценок всех предшествующих вершин, как и точной оценки корневой 
вершины и ее дочерних вершин, а значит, и искомого наилучшего 
первого хода. 

Формализуем все изложенное в виде компьютерного алгоритма. 
Для каждого узла введем два параметра: а — нижняя граница его зна- 
чения, Б — верхняя граница. 


Ецпсёіоп А1рһа Ве+а (п, а, р): Яопр1е; 
{Возвращает а} 


редіп 
1Е п = 1еаЕ їіһҺеп {п - концевая вершина} 
геїикп еуаї1 (п) {возвращает исход игры} 
е1 зе 
1Е п = пах їһеп {п - тах вершина} 
редіп 
{- = - очень малое отрицательное число} 
оа 


с трее: Ва. (в) 
{до тех пор, пока есть потомки } 
мае ре тапа: «0..0 


редіп 
9:= тах (9, А1Ірһа Веїа (с, а, Б)); 
а:= пах (а, 9); 
с:= пехіргоіћһег (с); 
епа; 
епа 
е1ѕе {п - тіп вершина} 
редіп 
{+ < - очень большое положительное число} 
Сеа = т 65 


се гатегећіаг (и) 
мһі1е 9 > а апа с +1 ао 
редіп 
ате дона: вега (еу. за. 5) 


Ь:= тіп(р, а); 
с:= пехіргоіћһег (с); 
епа; 
епа; 
ест 


епа; 


В тах – узле переменная © является нижней границей его значе- 
ния, которое после обновления а:= тах(а, о) будет передаваться в 
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рекурсивные вызовы АІрһа Веќа в качестве параметров. Аналогично 
обрабатываются и тіп - узлы, где © — текущая верхняя граница значе- 
ния узла. Отсечение дерева осуществляется условиями уе © < Би 
УПИ © > а соответственно. 

Пару параметров а и Б называют окном поиска. Предполагается, 
что каждый вызов АІрһа Веќа (п, а, Б) должен вернуть значение, ле- 
жащее в интервале (а, Б). Как только выясняется, что значение выхо- 
дит за рамки допустимого окна (а, Б), поиск прекращается. Для корня 
дерева делается вызов АІрһћа Веѓа (тоої, -оо, + оо), и тем самым обра- 
зом гарантируется правильность результата. В процессе обработки 
узлов окно поиска сужается, делая в результате все больше и больше 
отсечений. 

Таким образом альфа-бета-процедура является более эффектив- 
ной реализацией минимаксного принципа и всегда приводит к тому 
же результату (наилучшему первому ходу), что и простая минимакс- 
ная процедура той же глубины. 

Важным является вопрос, насколько в среднем альфа-бета про- 
цедура эффективнее обычной минимаксной процедуры. Нетрудно за- 
метить, что число отсечений в альфа-бета процедуре зависит от сте- 
пени, в которой полученные первыми предварительные оценки 
(альфа-бета-величины) аппроксимируют окончательные минимакс- 
ные оценки: чем ближе эти оценки, тем больше отсечений и меньше 
перебор. Это положение иллюстрирует пример на рис. 2.18, в кото- 
ром основной вариант игры обнаруживается практически в самом на- 
чале поиска. 

Наилучший случай (наибольшее число отсечений) достигается, 
когда при переборе в глубину первой обнаруживается конечная вер- 
шина, статическая оценка которой станет впоследствии минимаксной 
оценкой начальной вершины. При максимальном числе отсечений 
требуется строить и оценивать минимальное число концевых вершин. 
Показано, что в случае, когда самые сильные ходы всегда рассматри- 
ваются первыми, число концевых вершин глубины М, которые будут 
построены и оценены альфа-бета-процедурой, примерно равно числу 
концевых вершин, которые были бы построены и оценены на глубине 
№2 обычной минимаксной процедурой. Таким образом, при фикси- 
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рованном времени и памяти альфа-бета-процедура сможет пройти 
при поиске вдвое глубже по сравнению с обычной минимаксной про- 
цедурой. 

В среднем алгоритм Альфа-Бета обрабатывает не О(Ь), а О(Ь“°) 
узлов, то есть его сложность - квадратный корень от сложности ми- 
нимакса. Но в принципе возможен и неудачный порядок просмотра, 
при котором придется пройти (без отсечений) через все вершины де- 
рева, и в этом, худшем случае, альфа-бета-процедура не будет иметь 
никаких преимуществ против минимаксной процедуры. В связи с 
этим разрабатывались и разрабатываются усовершенствованные ал- 
горитмы альфа-бета-процедуры, например с применением сортиров- 
ки дочерних узлов (тах — узлов по возрастанию, тіп — узлов по убы- 
ванию значений) или на основе таблиц транспозиций, позволяющих 
отслеживать и сохранять возможные повторяющиеся позиции, тем 
самым устраняя необходимость в их повторном поиске. 


Контрольные вопросы 


1. Что такое понятие эвристика и какие существуют направле- 
ния эвристического программирования? 

2. Как представляется пространство состояний и какие сущест- 
вуют типы алгоритмов поиска в нем? 

3. В чем состоит отличие слепого перебора от эвристического? 

4. В чем состоит алгоритм поиска пути на графе? 

5. В чем заключается поиск в пространстве задач? 

6. Каковы принципы работы метода ОРЗ? 

7. Каковы назначение и особенности игр, где применяется эври- 
стический поиск? 

8. Что включает в себя игровая модель поиска? 

9. Какие существуют основные критерии окончания игры и в 
чем назначение оценочной функции? 

10. В чем состоит принцип работы минимаксной процедуры 
оценки позиций? 

11. Что такое альфа-бета процедура оценки позиций и каковы ее 
отличия и преимущества по сравнению с минимаксной? 
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Одним из проявлений интеллектуальности компьютерной сис- 
темы является возможность организации управления в ней знаниями 
человека (эксперта в некоторой предметной области). Теоретически- 
ми и практическими вопросами представления и обработки знаний в 
компьютерных системах занимается отдельное направление ИИ – 
инженерия знаний [12]. Программы, использующие достижения в 
этой области, образуют отдельный класс компьютерных систем, ос- 
нованный на знаниях. Главными структурными элементами таких 
систем являются базы знаний и механизм логических выводов. 

С позиций ИИ под знаниями подразумевают информацию, ко- 
торая необходима программе, чтобы она вела себя «интеллектуаль- 
но». Обычно такая информация представляется в виде фактов и пра- 
вил, которые ЭВМ может использовать при решении задач по таким 
алгоритмам, как логические выводы. Знания можно разделить на дек- 
ларативные и процедурные. Декларативные знания представляют со- 
бой описания фактов и явлений, а также связанных с ними законо- 
мерностей. Процедурные знания — это описание действий, которые 
возможны при манипулировании фактами и явлениями для достиже- 
ния намеченных целей. 

К типовым моделям представления знаний принято относить 
логическую, продукционную, фреймовую и модель семантической 
сети. Кроме этого, на практике часто находят применение их комби- 
нированные сочетания. 


3.1. Логическое представление знаний 


Логика как наука была создана Аристотелем (384 — 322 г. до 
н.э.). Логика — это наука о рассуждениях, которая позволяет опреде- 
лить истинность или ложность того или иного математического ут- 
верждения. 
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В основе логической модели лежит система исчисления преди- 
катов первого порядка, которая, в свою очередь, основана на исчис- 
лении высказываний. Под высказыванием будем понимать утвержде- 
ние, о котором в данной ситуации можно сказать, истинно оно или 
ложно. 

Пример 

А: «Сегодня четверг» - ложно или истинно в зависимости от те- 
кущего дня недели. 

В: «2+2=4» — абсолютно истинное высказывание. 

Эти высказывания являются элементарными или простыми, по- 
тому что их нельзя разделить на части. Из простых высказываний мо- 
гут быть построены сложные с помощью известных логических опе- 
раций: отрицания ( ), конъюнкции (л), дизъюнкции (у), импликации 
(—), эквиваленции (=), исключающего ИЛИ ($). При этом любое 
сложное высказывание может быть упрощено до выражения, содер- 
жащего только основные логические операции ( , л, у). 

Пример 

(4 В) (Ал В) = (АУ В)у(АуВ)=АуВУАУВЕ=1 


Для упрощения используются следующие эквивалентные 
преобразования. 
А В = А“ В; 


А= В= (А В) л (В А) = (А^ В) (Ал В); 
АФВ= (Ал В) (Ал В); 

Ау В= Ал В; 

А^В= Ах В; 
Ал(Ву С) = (Ал В) (Ал С); 

АУ (Вл С) = (Ау В) л (Ах С). 


В процессе упрощения любая логическая формула может быть 
приведена к эквивалентной ей конъюнктивной нормальной форме 
(КНФ). КНФ представляет собой конечное число дизъюнктов, объе- 
диненных операцией конъюнкции. 
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Пример 
(4 В) л (В э С) л (Ал С) = (А В) л (ВУС) л (АУС) 


Для проверки истинности высказываний используются таблицы 
истинности (табл. 3.1). 


Таблица 3.1 
Таблицы истинности логических операций 
А В АлВ | АВ | АВ | А=В | АФВ А 
0 0 0 0 1 1 0 1 
0 1 0 1 1 0 1 1 
1 0 0 1 0 0 1 0 
1 1 1 1 1 1 0 0 


Каждая логическая операция имеет множество правил интер- 
претации (табл. 3.2), на основании которых могут быть эффективно 
решены задачи описания знаний из различных прикладных областей. 


Таблица 3.2 
Правила интерпретации логических операций 
Операция Интерпретация 
4 «Не», «Неверно» 
Ал В «И», «Одновременно» 
Ау В «Или», «Хотя бы один» 
А В «Если А то В», «В необходимо для А», «А только, 


если В», «А достаточно для В», «В тогда, когда А», 
«А только тогда, когда В» 


А= В «Эквивалентно», «Равносильно» 
АФ В «Либо А, либо В», «Или А, или В» 
Пример 


На станцию должны прибыть три пассажирских поезда А, В и С. 
Ожидающие прибытия поездов пассажиры высказали следующие 
предположения: 

- для того, чтобы вовремя прибыл поезд А, не достаточно, чтобы 
вовремя прибыл поезд В; 

- поезд С опоздает или, если вовремя прибудет поезд А, то во- 
время прибудет поезд В; 

- прибытие по расписанию поезда А не является необходимым 
условием прибытия вовремя хотя бы одного из поездов В или С. 

Определить, какие из поездов прибыли вовремя. 
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Выделим из этого предложения элементарные высказывания. 

А: «Поезд А прибудет вовремя». 

В: «Поезд В прибудет вовремя». 

С: «Поезд С прибудет вовремя». 

Запишем каждое из предположений на языке логики в соответ- 
ствии с приведенными правилами интерпретации. 

1. В А; 


2, Су(А>В): 


3. (ВС) А. 


Составим общее логическое выражение и упростим его. 


(В А): (Сх (А В)): (ВУС) > А)= (Ву А): (Су АУ В): (ВСУ А) = 
(АВ): (Су АУ В)-(А- (ВУ С)) = (АВС У АВ у АВ): (АВ у АС) = 
АВ -(Су1У1):(АВУ АС) = АВ ~ АВС = АВ 


Из полученных результатов можно сделать вывод, что поезд А — 
не придет вовремя, В - прибудет вовремя, С — может как опоздать, так 
и прийти вовремя. 

Решение подобных задач связано с доказательством истинности 
или выполнимости логической формулы, то есть поиском такого на- 
бора значений переменных, при котором она равна «истине». 

Одной из ключевых сторон представления знаний с помощью 
логических моделей является возможность моделирования рассужде- 
ний. В этом случае применяется так называемый дедуктивный вывод 
от общего к частному. С его помощью могут быть решены такие за- 
дачи, как поиск следствия и поиск доказательства. Вывод представля- 
ет собой процедуру, которая из заданной группы выражений (логиче- 
ских утверждений ) выводит новое логическое выражение или след- 
ствие. Для этого могут быть использованы специальные правила вы- 
вода, состоящие из посылок или гипотез и утверждения, называемого 
заключением. Правильным заключением называется такое, которое 
истинно всякий раз, когда истинны гипотезы. Для описания правил 
вывода часто используется нотация, при которой над чертой 
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записывается группа выражений, принимаемых за посылки, а под 
чертой записывается заключение. 

Рассмотрим наиболее известные из существующих правил вы- 
вода [1, 12]. 

1. Модиз Ропепдо Ропепз: «Если истинна импликация А-В и А 
истинно, то В истинно ». 

2. Модиз ТоПепао ТоПепз: «Если истинна импликация А-В и В 
ложно, то А ложно». 

3. Мода Ропепаӣо ТоПепѕ: «Если А истинно и конъюнкция АлВ 
ложна, то В ложно». 

4. Модиз ТоПепао Ропепѕ: «Если А ложно и дизъюнкция АВ 
ложна, то В ложно ». 

5. Цепное заключение: «Если истинна импликация А—вВ и ис- 
тинна импликация В—С, то импликация 4-С является истинной ». 

Рассмотрим пример вывода с применением этих правил. Пусть 
заданы следующие посылки. 

1. РО: Если растут мировые цены на топливно-энергетические 
ресурсы, то увеличиваются поступления в бюджет. 

2. (КуО)>(К м5): Если наблюдается рост производства или уве- 
личиваются поступления в бюджет, то следует увеличение производ- 
ства или укрепление рубля. 

3. (РО) э ((РуО) > (КуО)): Если растут мировые цены на 
топливно-энергетические ресурсы, то увеличиваются поступления в 
бюджет, из чего следует, что при росте цен на сырье или при увели- 
чении поступлений в бюджет происходит рост производства или уве- 
личение бюджета. 

Используя правило 1, из посылок 1 и 3 можно вывести следую- 
щее заключение. 

4. (РуО)>(КуО): Если растут мировые цены на топливно- 
энергетические ресурсы или увеличиваются поступления в бюджет, 
то происходит рост производства или увеличение бюджета. 

Из посылок 4 и 2, используя правило 5, можно получить 
посылку 5. 
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5. (РуО)—>(К\у5): Если растут мировые цены на топливно- 
энергетические ресурсы или увеличиваются поступления в бюджет, 
то происходит рост производства или укрепление рубля. 

Таким образом, применяя правила логического вывода, можно 
получить новые логические формулы на основании исходных без ис- 
пользования таблиц истинности. Однако при значительном числе ис- 
ходных данных возможно получение большого числа цепочек выво- 
да, результаты которых могут противоречить друг другу. Для пре- 
одоления таких проблем должно быть организовано специальное 
управление стратегией логического вывода. 

У рассмотренных правил вывода есть одна особенность: они яв- 
ляются тавтологиями, то есть логическими формулами, значение ко- 
торых будет «истина» при любых значениях, входящих в них пере- 
менных. Докажем, что тавтологией является первое правило вывода, 
для этого построим таблицу истинности (табл. 3.3). 


Таблица 3.3 
Таблицы истинности для доказательства тавтологии 
А>В А л (АВ) Ал (АВ) >В 
0 1 


== о © 
оо > 


Ф | | 


0 1 
0 1 
1 1 


Такие тождественно истинные формулы также называются ак- 
сиомами исчисления высказываний. Множество аксиом образуют 
теорию заданной предметной области. Цель построения теории за- 
ключается в описании нужных знаний наиболее компактным спосо- 
бом. Если удается построить теорию, которая адекватно описывает 
заданную область знаний, то все истинные факты будут следствием 
аксиом этой теории. Таким образом, особенностью логического пред- 
ставления знаний является наличие возможности определения, име- 
ются или отсутствуют противоречия между новыми и уже сущест- 
вующими знаниями. 

Для тавтологий может быть применено правило подстановки: 
если С(А) — тавтология и вместо всех вхождений формула А в С под- 
ставить формулу В, то С(В) – тавтология. 
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В противовес тавтологиям в логике существуют противоречия — 
формулы, значением которых всегда будет «ложь» независимо от 
значений входящих в них переменных. Примером противоречия яв- 
ляется выражение Ал А=@ при любом А. 

Другим важным направлением в исчислении высказываний, на- 
ряду с поиском следствия, является автоматизация доказательства 
теорем. 

Доказательством будем называть конечный список формул 
В,.....В„, каждая из которых или является некоторой аксиомой исчис- 
ления высказываний, или получена по правилам вывода из некоторой 
пары формул, предшествующих в этом списке. 

Доказательство истинности полученной формулы может быть 
проведено с помощью таблицы истинности (при небольшом числе 
переменных), а также другими методами, одним из которых является 
принцип резолюций, предложенный Дж. А. Робинсоном в 1965 г. 
Этот принцип является правилом вывода и его основное достоинство 
состоит в возможности полной компьютеризации [12]. 

Известно, что КНФ не выполнима тогда и только тогда, когда 
ложен хотя бы один дизъюнкт. Принцип резолюции состоит в том, 
что невыполнимость формулы можно проверить, порождая логиче- 
ские следствия из нее до тех пор, пока не получится противоречие. 

Пусть 57 и 52 — дизъюнкты КНФ $, Г — переменная. 

Если 1є51 и Ге52, то дизьюнкт А = (5 1\{23) у (5 2\{2)) - ло- 
гическое следствие КНФ 5 (здесь символ «\» означает разность). 

Дизъюнкт А называется резольвентой дизъюнктов 5/ и 52. 

При этом А является логическим заключением из 5/ и $2, следо- 
вательно, добавление КНФ 5и 5\/{К} эквивалентны. 

Рассмотрим алгоритм доказательства невыполнимости логиче- 
ских формул, основанный на принципе резолюций. 

1. Преобразуем заданные посылки к КНФ 5 – множеству дизъ- 
ЮНКТОВ. 

2. Выбираем 2, 51, 52, такие что Ге51и 21є52. 

3. Находим А. 

4. Заменяем 5 на {А}. 

5. Продолжаем до тех пор, пока не получим противоречие. 
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Если процесс не останавливается, то есть множество дизъюнк- 
тов пополняется новыми резольвентами, среди которых нет искомого 
дизъюнкта, то в таком случае нельзя сделать заключение о выводи- 
мости формулы. 

Пример 

Предположим, нужно доказать, что, имея посылки Р-0, 
Р-Н и Р, нельзя вывести формулу ОН. 

1. Сформируем множество дизъюнктов $ и пронумеруем их. 

5 = {РУ 0(1), Ру Н(2), ОУ Н(3), Р(4)). 

2. Будем находить и добавлять к $ резольвенты. 

5. РуН(1, 3); 6.Р (2, 5); 7 © (4, 6). 

В скобках указаны 51, 52. Седьмой дизъюнкт является противо- 
речием, потому что одновременно можем в качестве следствия полу- 
чить утверждение (Р) и его отрицание (Р). Следовательно, нельзя по- 
лучить из имеющихся посылок заданное следствие. 

Отметим, что принцип резолюции послужил основой для созда- 
ния языка логического программирования Рго|о2. Работа его интер- 
претатора заключается в реализации автоматического вывода, подоб- 
ного приведенному на основе предварительно сформулированных 
пользователем правил. 

Многие утверждения, имеющие форму высказываний, на самом 
деле ими не являются, так как содержат переменные различных ти- 
пов, конкретные значения которых не указаны. Поскольку такое ут- 
верждение при одних значениях переменных может быть истинным, 
а при других — ложным, ему не может быть предписано истинное 
значение. Такое утверждение называется предикатом, а правило опи- 
сания знаний на основе их исчислением предикатов первого порядка. 

Пример 

В(х): З+х = 5; 

Предикат с одной переменной называется одноместным, п - п- 
местным. 

Изначально целью системы исчисления предикатов являлось 
разъяснение логических основ естественного языка. 
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Считается, что набор значений переменных удовлетворяют пре- 
дикату, если на этом наборе предикат принимает значение «истина» 
(В(2) – истина, В(4) — ложь). 

Некоторые предикаты истинны для любого возможного набора 
значений переменных, а другие только для некоторого. Для обозна- 
чения таких ситуаций в исчислении предикатов вводятся специаль- 
ные символы - кванторы. 

Ух В(х) - предикат с квантором всеобщности, имеет интерпре- 
тацию «для всех», то есть для любого значения х истинно В(х). 

Эх В(х) - предикат с квантором существования, имеет интерпре- 
тацию «для некоторого», то есть для некоторого (хотя бы одного 
значения) х истинно В(х). 

С помощью логики предикатов могут быть описаны фразы есте- 
ственного языка, которые не содержат внутри себя двусмысленно- 
стей. 

Пример 

«Для каждого действия существует равное и противоположно 
направленное противодействие» - УхЗу А(х, у); 

Ух, у,2[Отец(х, у) л Отец(у,2) > Дедушка(х,2)] - «Если х 
является отцом у, а у является отцом 2, то х является дедушкой 2»; 

Ух [Человек(х) —> (Эу) Отец(х, у)| - «Любой человек имеет отца». 

Чтобы предикат стал высказыванием, все его переменные долж- 
ны иметь конкретные значения или быть связанными. 

Пример 

Р(х, у,2):х? р > 22; 

(3х)(У2)Р(х,у,2) - не высказывание, так как у - свободная 
переменная. 

Предикаты могут быть использованы для организации дедук- 
тивных рассуждений, первая из известных моделей которых была 
предложена за 400 лет до нашей эры Аристотелем и называлась сил- 
логистикой. Рассмотрим наиболее простой способ проверки правиль- 
ности умозаключений на основе диаграмм Эйлера. 

Диаграммы Эйлера состоят из кругов, изображающих множест- 
ва. Так, утверждению «Все Р есть О» будет соответствовать диа- 
грамма, приведенная на рис. 3.1 а. 
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а) 6) 
Рис. 3.1. Диаграммы для кванторов всеобщности (а) и существования (6) 


Здесь круг, изображающий множество Р, содержится в круге, 
изображающем множество О. Другое утверждение, соответствующее 
квантору существования «Некоторые Р есть О», приведено на 
рис. 3.1 б как пересечение множеств Ри О. 

Для проверки умозаключений необходимо попытаться постро- 
ить диаграмму Эйлера, в которой посылки истинны, а умозаключение 
ложно. Если такое построение возможно, то умозаключение непра- 
ВИЛЬНО. 

Пример 

Проверить правильности умозаключения. 

Все студенты университета — выдающиеся люди; 


Все выдающиеся люди – ученые; 
Все студенты университета — ученые. 


На рис. 3.2 показана диаграмма, 
(су) построенная по условию задачи. В 
соответствии с посылками круг, изо- 
Вл бражающий студентов университета 
У (СУ), должен быть внутри круга, изо- 
бражающего выдающихся людей 
Рис. 3.2. Диаграмма для примера (ВЛ), который, в свою очередь, дол- 
жен быть внутри круга, изображаю- 
щего ученых (У). Следовательно, по имеющемуся заключению круг 
студентов должен находиться внутри круга ученых, то есть умозак- 
лючение верно. 
Пример 
Проверить правильность умозаключения. 
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Некоторые поэты -— неудачники; 
Некоторые ученые - неудачники; 
Некоторые поэты являются учеными. 


Как видно из рис. 3.3, можно 
построить такую диаграмму Эйлера, 
в которой пересечение кругов по- 
этов (П) и неудачников (Н) не пус- 
то, поэтому посылки истинны. Од- 
нако при этом круги поэтов и уче- 
ных не пересекаются, следовательно, заключение не верно. 

Пример 

Получить умозаключение. 


Рис. 3.3. Диаграмма для примера 


Все поэты счастливы; 


Некоторые поэты ленивы, 
ә 


В соответствии с посылками 
круг (рис. 3.4), изображающий поэтов 
(П), должен быть внутри круга, изо- 
бражающего счастливых людей (СЛ), 
а пересечение поэтов и ленивых лю- 
дей (ЛЛ) должно быть не пустым. 
Рис. 3.4. Диаграмма для примера Данное пересечение содержится в 

круге, изображающем поэтов и при 
этом пересечение ленивых и счастливых людей не пусто. Отсюда 
можно сделать умозаключение : «Некоторые ленивые люди 
счастливы». 

Для проверки более сложных предикатных предложений в ис- 
числении предикатов так же может быть использован принцип резо- 
люций. Однако для его применения необходимо выполнить более 
сложную унификацию формул для их приведения к системе дизъ- 
юнктов. Это связано с наличием дополнительных элементов синтак- 
сиса, в основном кванторов, переменных, предикатов и функций. 
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Алгоритм унификации включает этапы их преобразования сначала в 
префиксную, а затем сколемовскую нормальные формы [12]. В то же 
время предикатная формула может допускать множество нормальных 
форм и их интерпретаций, вид полученных результатов зависит от 
порядка применения правил, а также от способа переименования свя- 
занных переменных. Поэтому эффективное применение принципа ре- 
золюций для автоматизации логического вывода становится возмож- 
ным лишь в частных случаях. 


3.2. Представление знаний семантическими сетями 


Под семантической сетью (СС) обычно подразумевают систему 
знаний некоторой предметной области, представленной в виде сети — 
ориентированного графа, узлы которого выражают понятия, события, 
а также свойства предметной области, а дуги являются описаниями 
их отношений. При этом все узлы и дуги могут быть снабжены мет- 
ками, которые показывают, что именно они описывают [1, 3]. 

Формально семантическую сеть можно представить как 
5№ = <Х ,В>, где Х – множество объектов сети, а А — множество от- 
ношений между ними. 

Понятия представляют собой сведения об абстрактных или фи- 
зических объектах предметной области. 

События представляют собой действия, происходящие в реаль- 
ном мире, определяются указанием типа действия и ролей, которые 
играют объекты в этом действии. 

Свойства используются для уточнения понятий и событий. 
Применительно к понятиям они описывают их особенности и харак- 
теристики (цвет, размер и др.), а применительно к событиям — про- 
должительность, время, место. 

Дуги графа сети отображают многообразие семантических от- 
ношений, которые можно условно разделить на четыре класса: лин- 
гвистические, логические, теоретико-множественные и квантифици- 
рованные. 


65 


Лингвистические отношения выражают смысловую взаимо- 
связь между событиями, между событиями и понятиями или свойст- 
вами. При этом лингвистические отношения бывают: 

- глагольные (время, вид, род, залог, наклонение); 

- атрибутивные (цвет, размер, форма); 

- падежными. 

Логические отношения представляют собой операции, исполь- 
зуемые в исчислении высказываний: дизъюнкция, конъюнкция, ин- 
версия, импликация. 

Теоретико-множественные представляют собой отношение 
подмножества, отношение части и целого, отношение множества и 
элемента. Типовыми примерами здесь являются отношения включе- 
ния или совпадения (15-А) и отношение «целое-часть» (РАКТ-ОР). 

Квантифицированные отношения представляют собой кван- 
торы общности и существования и используются для описания таких 
знаний, как «любой автомобиль требует ремонта», «существует води- 
тель А, управляющий автомобилем В». 

В общем случае систематизация отношений конкретной семан- 
тической сети зависит от специфики знаний предметной области и 
является сложной задачей. 

На рис. 3.5. изображён пример описания структуры понятий с 
помощью семантической сети. Он иллюстрирует ситуацию взаимоот- 
ношения птицы и самолета. 


Орел 
ТУ-134 = = Р 
Является Крылья 
у Имеет Является \ 
27 Длинный 
Самолет Умеет 
Имеет 
Умеет 
Мвт | Летать «Птица > Клюв 
Мотор Использует Использует 
Использует кр а 
Ба" Законы Оперение 
Нин аэродинамики е 


Рис. 3.5. Представление структуры понятий в виде семантической сети 
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При описании событий и действий с помощью семантической 
сети должны быть определены объекты, которые действуют, и объек- 
ты, над которыми эти действия выполняются. Связываются события 
и объекты с действиями с помощью падежных отношений (табл. 3.4) 


Таблица 3.4 
Основные падежные отношения 
Квалификатор Объекты, с которыми связывается действие 
отношения 
Агент Предмет, являющийся инициатором действия 
Объект Предмет, подвергающийся действию 
Источник Размещение предмета, перед действием 
Приемник Размещение предмета после действия 
Время Момент выполнения действия 
Место Место проведения действия 
Цель Действие другого события 


На рис. 3.6 показан пример семантической сети, описывающей в 
виде событий и действий ситуацию, связанную с закупкой и достав- 


кой товаров. 


агент объект агент 


27.04.2007 цель 


агент объект 


Рис. 3.6. Представление событий и действий в виде семантической сети 


объект 


приемник 


объект 


Существуют разные типы семантических сетей: дискретные, 
аналоговые, иерархические, гибридные [14]. 
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Семантическая сеть называется дискретной, если в ней имеются 
только два возможных состояния связей между двумя вершинами — 
есть связь или нет. 

Семантическая сеть называется аналоговой, если в ней состоя- 
ния связей между вершинами і и / выражается величиной проходи- 
мости АЙ , которая может изменяться в некотором диапазоне значе- 
ний. Величина ЛИ выражает силу соответствующей связи между 
вершинами Ги /, что позволяет отображать в сети различные оттенки 
сигнала. 

Семантическая сеть называется иерархической, если в ней име- 
ется в основном один тип связей — парадигматический, отражающий, 
например, родовые отношения. 

Гибридные семантические сети сочетают свойства выше опи- 
санных типов семантических сетей. Так, нижний уровень такой сети 
может быть дискретного типа, а верхний – аналогового. 

Процедура логического вывода обычно определяется через от- 
ношения между множеством дуг, имеющих общие узлы. Можно вы- 
делить два подхода к организации логического вывода на семантиче- 
ской сети: дедуктивный и семантический. 

Дедуктивный вывод основан на логическом формализме, когда 
семантическая сеть представляется в виде графа и, по сути, реализует 
графовую версию исчисления предикатов. Здесь дуги соединяют 
имена предикатов с их аргументами, которым соответствуют опреде- 
ленные типы узлов сети. 

Семантический вывод основан на извлечении из семантической 
сети новой информации путем поиска в ней, а затем интерпретации 
интересующих нас участков. Примером такого вывода может слу- 
жить метод поиска пересечений. 

Этот метод выделяет участок сети, связанный с входными поня- 
тиями ХІ, Х2,...„Хп. Суть метода состоит в том, чтобы, начиная с 
вершин ХІ, Х2,...,Хп и двигаясь по дугам, помеченным транзитивны- 
ми отношениями, искать такие понятия (возможно, ближайшие в не- 
котором смысле), которые находятся на пересечении построенных 
путей. Тогда множество найденных вершин и соединяющих их дуг 
образуют контекст, связывающий исходные понятия ХІ, Х2,...,Хи. 
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Семантические сети обладают набором таких свойств, как хра- 
нение сведений об объектах системы и связях между ними, быстрый 
поиск объекта по заданным характеристикам, возможность обобще- 
ния и конкретизации знаний, которые обусловливают их широкое ис- 
пользование среди исследователей в качестве средства умозаключе- 
ний. Кроме этого, семантические сети находят применение при соз- 
дании экспертных систем и систем распознавания речи. 


3.3. Фреймовая модель представления знаний 


Эта модель основана на теории фреймов М. Минского, которая 
представляет собой систематизированную психологическую модель 
памяти человека и его сознания. Эта теория является достаточно аб- 
страктной, поэтому описание на ее основе знаний возможно только в 
сочетании с другими языками, в частности объектно- 
ориентированного программирования [3, 12]. 

Во фреймовой системе за единицу представления принят объ- 
ект, называемый фреймом. С точки зрения памяти фрейм — единица 
представления знаний, запомненных в прошлом, детали которой при 
необходимости могут быть изменены согласно текущей ситуации. 
Алгоритмически фрейм – это структура для описания понятия или 
ситуации, состоящая из характеристик этой ситуации и их значений. 
Фрейм имеет имя, служащее для идентификации описываемого им 
понятия, и содержит ряд слотов, с помощью которых описываются 
основные элементы этого понятия. Слот может содержать не только 
конкретное значение, но также имя процедуры, позволяющей вычис- 
лить это значение по заданному алгоритму. Так, слот с именем «воз- 
раст» может содержать имя процедуры, которая вычисляет возраст 
человека по дате рождения, записанной в другом слоте, и текущей 
дате. Процедуры, располагающиеся в слотах, называются присоеди- 
ненными процедурами, их вызов происходит при обращении к слоту, 
в котором она помещена. 
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В общем случае структура данных фрейма может содержать 
следующие атрибуты [1]. 

Имя фрейма. Служит для идентификации фрейма в системе и 
должно быть уникальным. 

Имя слота. Должно быть уникальным в пределах фрейма. Мо- 
жет быть или назначено проектировщиком, или выбрано из систем- 
ных, зарезервированных имен. Системные слоты служат для управ- 
ления выводом во фреймовой системе. Примером такого слота может 
быть слот-указатель дочерних фреймов (18-А). 

Указатели наследования. Показывают, какую информацию об 
атрибутах слотов из фрейма верхнего уровня наследуют слоты с ана- 
логичными именами в данном фрейме. 

Указатель типа данных. Показывает тип значения слота. Наи- 
более типичные типы: Нате — указатель на фрейм; геа! — веществен- 
ное число; іпіерег - целое число; 1151 — список и др. 

Значение слота. Оно должно соответствовать указанному типу 
данных и условию наследования. 

Демоны. Демоном называется присоединенная процедура, ав- 
томатически запускаемая при выполнении некоторого условия, при 
обращении к некоторому слоту. Типы демонов связаны с условием 
запуска процедуры. Демон с условием ІЕ-МЕЕРЕР (ЕСЛИ-НУЖНО) 
запускается, если в момент обращения к слоту его значение не уста- 
новлено. Демон типа ІЕ-АРрЕр (ЕСЛИ-ДОБАВЛЕНО) запускается 
при попытке изменения значения слота. Демон Е-КЕМОУЕРО (ЕС- 
ЛИ-УДАЛЕНО)запускается при попытке удаления значения слота. 
Возможны и другие виды демонов. 

Присоединенная процедура. Может быть значением слота и 
запускается по сообщению, переданному от другого фрейма. Демоны 
и присоединенные процедуры являются процедурными знаниями, 
объединенными вместе с декларативными в единую систему. Эти 
процедурные знания являются средствами управления выводом во 
фреймовых системах. 

Совокупность данных предметной области может быть пред- 
ставлена множеством взаимосвязанных фреймов, образующих еди- 
ную фреймовую систему, в которой объединяются декларативные и 
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процедурные знания. Такая система имеет, как правило иерархиче- 
скую структуру, в которой фреймы соединены друг с другом с 
помощью родо-видовых связей. На верхнем уровне иерархии нахо- 
дится фрейм, содержащий наиболее общую информацию, истинную 
для всех остальных фреймов. Для уменьшения информационной из- 
быточности во фреймовых системах реализуется принцип наследова- 
ния информации, позволяющей общую (глобальную для системы) 
информацию хранить в отдельном родительском фрейме, а во всех 
остальных фреймах указывать ссылку на место хранения этой ин- 
формации. В качестве примера рассмотрим фреймы, приведенные на 
рис. 3.7. 


ЧЕЛОВЕК 


Млекопитающее 
Умеет Мыслить 


РЕБЕНОК 


И 


УЧЕНИК 


Рис. 3.7. Пример сети фреймов 


Как следует из рис. 3.7 понятие «ученик», описываемое соответ- 
ствующим фреймом, наследует свойства фреймов «ребенок» и «чело- 
век», которые находятся на более высоких уровнях иерархии. При 
возникновении вопроса «Любят ли ученики сладкое?», будет получен 
ответ «да», потому что этим свойством обладают все дети, что указа- 
но во фрейме «ребенок». Наследование может быть частным, напри- 
мер, слот «возраст» для учеников не наследуется из фрейма 
«ребенок», так как явно указан в собственном фрейме. 
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Над фреймами можно совершать некоторые теоретико- 
множественные операции, например объединение или пересечение. В 
первом случае в результирующем фрейме будут присутствовать все 
слоты, которые были в исходных. Во втором — результирующий 
фрейм будет содержать только одинаковые для всех фреймов слоты. 

Фреймовые системы подразделяются на статические и динами- 
ческие, последние допускают изменение фреймов в процессе реше- 
ния задачи. 

Можно выделить три основных способа вывода на фреймовой 
сети: 

- объектно-ориентированное программирование, когда фрейм 
подменяется понятием объект, сочетающим в себе данные и подпро- 
граммы для их обработки — методы. 

- логико-объектные правила вывода объединяют предыдущую 
технологию с логическим выводом. 

- специальные методы вывода, которые определяются непосред- 
ственно разработчиком. 


3.4. Представление знаний правилами продукций 


В продукционной модели описания знаний, предложенной 
Э. Постом, знания описываются в форме «ЕСЛИ - ТО». Условная 
часть правила «ЕСЛИ» называется посылкой или антецедентом, а 
часть «ТО» - заключением (продукцией) или консеквентом. Подобное 
представление знаний является наиболее простым и легко понимае- 
мым, потому что близко к привычной нам форме рассуждений. 

Пример 

Если «животное имеет перья», ТО «животное - птица». 

Условная часть правила может состоять из множества элемен- 
тарных высказываний, соединенных логическими связками И, ИЛИ. 
В свою очередь, заключение выражает либо некоторый факт, либо 
указание на определенное действие, подлежащее исполнению, при 
истинности условной части. 
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Математически продукционная модель может быть описана как 
<(Г,О,Р, А>> В, М >, где 

і — имя продукции. В качестве имени может выступать понятие, 
отражающее суть данной продукции или порядковый номер, храня- 
щийся в памяти системы; 

О – сфера применения продукции. Разделение на отдельные 
сферы позволяет экономить время на поиск нужных знаний. 

А-эВ – ядро продукции. 

Р – условие применимости ядра продукции. Р представляет со- 
бой логическое выражение, истинность которого приводит к активи- 
зации продукции. 

М – постусловие продукции, которое необходимо выполнить по- 
сле реализации консеквента В. 

Ядро продукции может быть как однозначным и детерминиро- 
ванным «ЕСЛИ А, ТО В», так и многозначным и недетерминиро- 
ванным «ЕСЛИ А, ТО чаще всего ВІ, реже В2». Во втором случае 
указываются альтернативные возможности выбора, которые оцени- 
ваются заданными статическими или динамическими приоритетами. 

Интеллектуальные системы, где используется такой способ 
представления знаний, получили название продукционных. В состав 
таких систем входят база правил, содержащая совокупность знаний, 
описанных в продукционной форме, база данных или рабочая память 
и содержащая полученные в ходе работы заключения, а также интер- 
претатор правил, реализующий механизм вывода (рис. 3.8). 


Интерпретатор 
База данных База правил 
(рабочая память) 


Рис. 3.8. Продукционная система 


Механизм вывода состоит в замене одного фрагмента (А) базы 
правил другим фрагментом (В) и работает циклически до тех пор, по- 
ка не будут исчерпаны все правила или выполнено некоторое условие 
окончания. При этом может возникнуть конфликт выбора правил в 
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случае многозначных продукций. Для его разрешения используются 
различные стратегии управления выводом, например через задание 
приоритетности выбора. 

Содержимое рабочей памяти изменяется в процессе решения за- 
дачи. Это происходит по мере срабатывания правил. Правило сраба- 
тывает, если при сопоставление фактов, содержащихся в рабочей па- 
мяти с заключением анализируемого правила, имеет место совпаде- 
ние. При этом заключение сработавшего правила заносятся в рабо- 
чую память. В процессе логического вывода каждое правило из базы 
правил может сработать только один раз [1]. 

Пример 

Пусть в базе правил имеются следующие правила. 

Правило 1. «ЕСЛИ двигатель не заводится И фары не горят, ТО 
Сел аккумулятор». 

Правило 2. «ЕСЛИ указатель бензина находится на нуле, ТО 
Двигатель не заводится». 

Предположим, что в рабочую память от пользователя поступили 
следующие факты: «Фары не горят» и «Указатель бензина находится 
на нуле». 

Процедура вывода в такой системе будет включать следующие 
шаги. 

1. Сопоставление фактов из рабочей памяти с образцами правил 
из базы правил. Правило 1 не может сработать, а Правило 2 срабаты- 
вает, так как образец, совпадающий с его посылкой, присутствует в 
рабочей памяти. 

2. В результате срабатывания Правила 2 в рабочую память зано- 
сится заключение этого правила: «Двигатель не заводится». 

3. Второй цикл сопоставления фактов в рабочей памяти с 
имеющимися правилами. Теперь срабатывает Правило 1, так как 
конъюнкция условий в его антецеденте становится истинной. 

4. Действие Правила 1, которое заключается в выдаче пользова- 
телю окончательного заключения – «Сел аккумулятор». 

5. Конец работы (база правил исчерпана). 

В продукционных системах существует два основных способа 
получения заключений — прямые и обратные выводы. Прямые 
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выводы реализуют стратегию «от фатов к заключениям». При обрат- 
ных выводах выдвигаются гипотезы вероятных заключений, которые 
могут быть подтверждены или опровергнуты на основании фактов, 
поступающих в рабочую память. 

Рассмотрим пример обратного порядка вывода — от заключений 
к фактам. Предположим, что в базе правил находятся два правила: 
Правило]! и Правило 2, а в рабочей памяти — те же факты, что и в 
предыдущем примере. Процедура вывода в этом случае будет вклю- 
чать следующие шаги. 

1. Выдвигается гипотеза об окончательном заключении — сел ак- 
кумулятор. 

2. Определяется правило, заключение которого соответствует 
выдвинутой гипотезе. Для нашего случая — Правило 1. 

3. Проверяется возможность срабатывания Правила 1. Для этого 
в рабочей памяти должны присутствовать факты, совпадающие с об- 
разцом этого правила. В нашем случае Правило 1 не может сработать 
из-за отсутствия в рабочей памяти образца «Двигатель не заводится». 
Этот факт становится новой целью на следующем шаге вывода. 

4. Поиск правила, заключение которого соответствует новой 
цели. Это Правило 2. 

5. Проверяется возможность применения Правила 2. Оно сраба- 
тывает, так как в рабочей памяти присутствует факт, совпадающий с 
его образцом. 

6. Выполняется Правило 2. В результате заключение «Двигатель 
не заводится» заносится в рабочую память. 

7. Для условной части Правила 1 в рабочей памяти теперь есть 
все факты, поэтому подтверждается первоначально выдвинутая гипо- 
теза. 

8. Конец работы. 

Таким образом, результатом работы является подтверждение 
гипотезы «Сел аккумулятор», при условии «Двигатель не заводится» 
и «Фары не горят». 

Основные достоинства продукционных систем связаны с про- 
стотой представления знаний и организацией логического вывода, 
особенно при использования небольшого (десятки) числа правил. 
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Наиболее часто продукционные системы используются при создании 
экспертных систем диагностики для различных предметных областей. 

Рассмотренные способы представления знаний предполагают, 
что в конкретной предметной области знания описываются в детер- 
минированной форме и являются абсолютно достоверными. В то же 
время задача компьютеризации этих знаний полностью выполняется 
экспертами, мнения которых являются субъективными и могут не 
совпадать. В таких случаях при описании знаний могут появляться 
формулировки вида «примерно», «немного», «почти» и т.п., форма- 
лизация которых в принципе не может быть выполнена традицион- 
ными способами. Поэтому в последнее время большое распростране- 
ние получили методы описания таких нечетких знаний с помощью 
математического направления, известного как теория нечетких мно- 
жеств. 


3.5. Представление нечетких знаний 


Одним из ключевых проявлений человеческого мышления явля- 
ется способность обрабатывать нечеткую информацию, характери- 
зующуюся неполнотой и неопределенностью, свойственным многим 
классам реальных проблем. Поэтому важным является создание эф- 
фективных методов для отображения таких нечеткостей реального 
мира и моделирования приближенных рассуждений человека в ком- 
пьютерных системах. Значительный вклад в эту область был сделан 
профессором Калифорнийского университета (Беркли) Л. Заде, соз- 
давшим математический аппарат теории нечетких множеств. С его 
помощью могут быть эффективно описаны нечеткие понятия и зна- 
ния, а также выполняться операции над этими знаниями, нечеткие 
выводы. Широкое практическое применение теория нечетких мно- 
жеств получила в таких задачах как автоматическое управления, при- 
нятие решений, представление и обработка знаний и др. Далее кратко 
рассматриваются основы этой теории [1, 14]. 
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Основные понятия нечетких множеств. В основе теории не- 
четких множеств лежит расширение классического понятия множест- 
ва за счет возможности принимать функции принадлежности элемен- 
та множеству любых значений в интервале [0, 1], а не только фикси- 
рованных значений 0 либо 1. 

Пусть И полное множество объектов некоторого класса. Нечет- 
кое подмножество Ё множества (, именуемое далее нечетким мно- 
жеством определяется через функцию принадлежности ир(и),иЕО. 
Эта функция отображает элементы и множества И на множество ве- 
щественных чисел отрезка [0, 1], которые указывают степень принад- 
лежности каждого элемента нечеткому множеству РЁ. 

Если полное множество И состоит из конечного числа множеств 
и, Ио ,...и„, то нечеткое множество / можно представить в следую- 


щем виде: 


Е = рещ)! + шеи) +... ир(и,) Ги, = > ие(и)/щ. 
=] 


Важно, что в этом выражении знак «+» означает не сложение, а 
скорее объединение, символ / показывает, что значение шр (и; )/и; от- 
носится к элементу џи;, а не означает деление на него. 

В случае непрерывного множества И можно / записать как ин- 


теграл Е = | иь (и)/и. 


В качестве примера рассмотрим И — множество людей в возрас- 
те от 0 до 100 лет, и пусть понятия «молодой», «среднего возраста» и 
«старый» представлены нечеткими множествами РЁ 1, Е2 и ЕЗ соответ- 
ственно. Эти нечеткие множества являются подмножествами множе- 
ства Ц. Функции принадлежности элементов множества И к поняти- 
ям, представленным нечеткими множествами 2/1, Е2, ЕЗ показаны на 
рис. 3.9. 
При этом форма задания значений нечетких множеств имеет 
следующий вид: 
Е1= ин (и) =1/0+1/10+0,8/20 + 0,3/30; 
Е2 = и. (и) = 0,5/30+1/40+ 0,5/50; 


ЕЗ = и, (и)=0,4/50 + 0,8/60+1/70 +1/80 + 1/90. 
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Рис. 3.9. Функции принадлежности нечетких множеств примера 


Как следует из рис. 3.9 принадлежность к нечеткому множеству 
ЕІ, соответствующему понятию «молодой», составляет 1 для детей, 
0,8 — для двадцатилетнего человека, а степень принадлежности три- 
дцатилетнего равна 0,3. При записи функции принадлежности эле- 
менты нечеткого множества со значениями Џур (и;)/и; = 0 не включа- 
ются. Аналогично описаны функции принадлежности для двух дру- 
гих нечетких множеств. 

Отметим, что обычно функции принадлежности для нечетких 
множеств строятся субъективно по результатам опросов экспертов. 

Операции над нечеткими множествами. Подобно классиче- 
ским над нечеткими множествами можно выполнять теоретико- 
множественные операции. Далее рассматриваются основные из них: 
дополнение, объединение и пересечение. 

1. Операция дополнения 


ЕР= У(1-иь(и))/и, иеби) =1- иуи). 
і=1 


Следуя примеру, дополнением нечеткому множеству «молодой» 
будет соответствовать нечеткое множество понятия «немолодой», 
функция принадлежности которого показана на рис. 3.10, а матема- 
тическая запись имеет вид: 

молодой = шъ = 0.2120 + 0.7/30 + 1/40 + 1/50 +1760 + 1/70 +1780 +1790. 


Шг А 
1— 


0.5- 


лет 


Рис. 3.10. Функция принадлежности дополнения нечеткого множества РЁ] 
2. Операция объединения 


Роб=У (ии) м поб) ицро) =ир(и) у ис (и). 
1=] 


Здесь операция \ соответствует взятию максимума. Для опреде- 
ления понятия, которому будет соответствовать объединение нечет- 
ких множеств Е/ и 22, вычислим функцию принадлежности: 
(молодой ‹ средний) = ик (и)=1/0+1/10 +0,8/20 + 0,5/30 + 1/40 + 0,5/50. 


Ниже на рис. 3.11 приводится график этой функции, а ее лингвисти- 

ческой интерпретацией является понятие «человек молодого или 

среднего возраста». 
Ше А 

1 


ШЕЕ? 


0.5- 


ШЕЕ? 


лет 


Рис. 3.11. Функция принадлежности объединения нечетких множеств Е и Е2 


3. Операция пересечения 


ЕС = У (ии) лис) и ие ло) =иғб(и) лои). 
1=] 
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Здесь операция л соответствует взятию минимума. Для опреде- 
ления понятия, которому будет соответствовать пересечение мно- 
жеств А/ и Е2, вычислим функцию принадлежности: 

(молодой Г средний) = ик ко(и) = 0,3/30 

Остальные члены этой функции, соответствующие значениями 
аргумента, кратным 10, равны нулю. На рис. 3.10 приводится график 
этой функции, а ее возможными лингвистическими интерпретациями 
являются понятия «уже не молодой, но еще не средний возраст», 
«одновременное молодой и средний возраст». 

Нечеткие отношения. Часто понятия предметной области свя- 
заны различными отношениями. Для организации нечетких выводов 
необходимо формализовать понятие нечеткого отношения. 

Нечетким отношением А между полными множествами (и Г 
называется нечеткое подмножество прямого декартова произведения 
Ох Г, определяемое следующим образом: 


1 т 
= >, Х,ив(и,у;)/(и;,у;), 


і=1 =] 
где (7 = {иу,и,...,и,„}, Г = №... Уи} 


Предположим, что между понятиями, представленными нечет- 
кими множествами Ес<И и СсуУ, существует отношение, заданное 
правилом «ЕСЛИ Е, ТО С». Тогда один из способ построения такого 
нечеткого отношения № между Ри С состоит в следующем: 

1 т 
К= ЕхС = ик (и) ^ис(у;) (иу), ив(и,»)=ир(и) ^ис(у). (3.1) 
і=1 ј= 

Пусть О и У множества натуральных чисел от 1 до 4. Определим 
понятия «малые числа» и «большие числа» с помощью нечетких 
множеств Ри С соответственно. 

ОС= /= {1,2,3 ,4}; 

Е = 1/1 + 0.6/2 + 0.1/3; 

С = 0.1/2 + 0.6/3 + 1/4. 

Пусть задано правило: «ЕСЛИ и – малое число, ТО у - большое» 
или К э С. Построим для него соответствующее нечеткое отношение 
К = ЕхС. 
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и; 


0 01 06 1 

В, №: | 02-00 206: 06 
0 01 01 01 
ооо о 


Заметим, что наряду с рассмотренным есть и другие способы за- 
дания нечетких отношений. 

Композиция нечетких отношений. Необходима при наличии 
цепочки правил, образующих знания в виде нечетких множеств, от- 
ношений. Выполнена она может быть с помощью операций свертки, 
которые включают максиминную, минимаксную, максимультиплика- 
тивную и др. Рассмотрим применение наиболее распространенной - 
первой из них. 

Пусть А – нечеткое отношение из области И в область Г, а 5 – 
нечеткое отношение из области / в область множества //. Тогда не- 
четкое отношение из И в область Й’ определяется как максиминная 
свертка 

[п 
д.р. (др (иу) ^ из, мхи, му), (3.2) 
і=1=16/ 

где у - знак взятия максимума для всех у,; 

л - знак взятия минимума. 

Пусть для Ў = {1, 2, 3, 4} определены следующим образом не- 
четкие множества: 

Е (СГ) = «не малые числа» = 0/1+0.4/2+0.9/3+1/4; 

Н(с И’) = «очень большие числа» = 0/1+0/2+0.5/3+1/4. 

Тогда, если есть правило «ЕСЛИ у не малое число, ТО у очень 
большое число», нечеткое отношение 5 из Гв И’ согласно (3.1) опре- 
деляется как 


УХ 
оо о о 
= 010 0 04 04 
о о 05 09 
0005 1 


Если далее вычислить по формуле (3.2) свертку с нечетким от- 
ношением А, то из двух значений «ЕСЛИ и - малое число, 
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ТО у - большое», «ЕСЛИ у не маленькое число, ТО у очень большое» 
получим следующее нечеткое отношение из (в И: 


Во уши лгон) 


о 01 06 1| 000 о и, 

_10 01 0,6 0,6 |0 0 0,4 04|. оо То5 ет 

10 ол ол 011 10 о 0,5 09 Ш ? у 12 06 
оо о 0 00 0,5 1 Ро 


Полученное нечеткое отношение показывает взаимосвязь облас- 
тей Чи №. При парных сравнениях элементов і-й строки и /-го столб- 
ца из них выбирается наименьший. Затем из четырех минимальных 
элементов выбирается максимум, который является результатом и за- 
писывается в ячейку с координатами /, /. 

Нечеткие выводы. Рассмотрим традиционный дедуктивный 
метод логического вывода Мойџоѕ Ропепао Ропепѕ для нечетких мно- 
жеств. Его интерпретация «Если К – истина И импликация Е э С то- 
же истина» то С — истина» в этом случае остается неизменной. Одна- 
ко в среде нечетких множеств этот вывод записывается с некоторыми 
изменениями: из факта Е’ и правила Е э С можно вывести С’. Здесь 
Е”, С’ образуют нечеткие множества рассматриваемого правила вы- 
вода на полных множествах Ё, С соответственно. 

Для организации нечеткого отношения из правила К э С’ мо- 
жет быть использована формула (3.1), а при наличии цепочки из не- 
скольких правил вывода — максиминная свертка (3.2). В свою очередь 
вывод С’ определяется из максиминной свертки нечеткого множества 
Е’и отношения А: 

т 
а (де (иг) ^ ив(иг,у;))/у;, (3.3) 
и 

где А, "СО; а, С'СҮ. 

Пусть, продолжая предыдущий пример, О = У = {1, 2, 3, 4}, 
Е(с О) = «малые числа», С(с/У) = «большие числа». Кроме того, 
пусть в качестве исходной посылки для вывода задан факт 
«и — число около 2», представленное нечетким множеством 
Е’ = «около 2» = 0,3/1+1/2+0,3/3+0/4. 
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Пусть также задано правило Е э С: «ЕСЛИ и- малые числа, то 
у - большие», формализованное в виде ранее описанного отношения 
К. Используя комбинационное правило вывода (3.3), определим вы- 
вод С’, соответствующий ответу на вопрос «Что представляет собой 
у, если и — число около 2?» и если области Ц и Г связаны отношением 
К. 
0 0,1 0,6 1 
0 0,1 0,6 0,6 
С'= Ею '=[0,3 1 0,3 0]о =[0 01 0,6 0,6] 
0 0,1 0,1 0,1 
ооо о 


Здесь в результирующем векторе каждый элемент / представля- 


ет значение принадлежности у, множества С’. На рис. 3.12 показан 


график функции принадлежности результата нечеткого вывода. 


Иск 
1— А АЕА ИЕА ЛА ДОРА ЕКА АВ КРАЕ РТА 


0.5- 


1 2 3 4 у 


Рис. 3.12. Функция принадлежности результата нечеткого вывода 


Исходя из графика можно предложить следующую лингвисти- 
ческую интерпретацию: «у – не очень большое число» или «у — до не- 
которой степени большое число». 

При описании объектов и явлений с помощью нечетких мно- 
жеств используется понятие нечеткой переменной, которая может 
принимать нечеткие значения. 

Нечеткая переменная определяется тройкой <а, О, Р>, 

где а - наименование переменной; 

(И – универсальное множество, область определения с; 

Е — нечеткое множество на (О, описывающее ограничения на 
возможные нечеткой переменной а. 
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Обычно нечеткие переменные используются для моделирования 
различных систем, и, следовательно, над этими переменными прихо- 
дится выполнять большие объемы разных операций. Для удобства 
реализации этого, а также организации ввода-вывода и хранения ин- 
формации рекомендуется использовать функции принадлежности 
стандартного вида, с которыми проще выполнять расчеты. В частно- 
сти, такими функциями являются трапециевидные (рис. 3.13), где 
ик(и) характеризуется <т, п, [, К>. Как частный случай при т = п 
получается треугольная форма функции принадлежности. 

Ие(и) А 
УНИИ | Е НЕНЕИ 


т - | т П п+К О 


Рис. 3.13. Трапециевидная функция принадлежности 


В качестве примера рассмотрим ситуацию, когда при составле- 
нии проекта бюджета рассматриваются различные источники финан- 
сирования. Причем некоторые из них характеризуются неточностью 
оценки денежных сумм на день оценивания, а другие малой надежно- 
стью. Кроме того, из бюджета необходимо отдать долги, количество 
которых также неточно, так как зависит от того, потребует ли креди- 
тор все или только часть в следующем финансовом периоде. Экспер- 
ты высказали следующие предположения об источниках финансиро- 
вания и долге. 

Источник А: финансирование обеспечивается, его сумма может 
изменяться от 40 до 100 млн в зависимости от конъюнктуры, но с 
наибольшей вероятностью можно ожидать поступления в сумме от 50 
до 70 млн. 

Источник В: источник надежен и разумно полагать, что финан- 
сирование будет предоставлено и составит сумму 100 - 110 млн. 


84 


Источник С: источник ненадежен, а если и даст, то не более 20 
МЛН. 

Долг р: плата за кредиты 50 - 100 млн., но наиболее вероятна 
выплата 80 млн. 

В результате имеется три источника поступлений и один источ- 
ник расхода. Построим на основе их описаний трапециевидные 
функции принадлежности для каждой из четырех нечетких перемен- 
ных (рис. 3.14). После задания всех нечетких переменных возникает 
задача определения суммы всего бюджета, которая также будет не- 
четкой величиной. А для этого требуется выполнить арифметические 
операции над нечеткими переменными. 


Ша(и) д 
1— а лай еее ееееене-н----- 


100 и 100 110 Ц 


20 0 
В) 


Рис. 3.14. Нечеткое описание проекта бюджета: 
а— А = (50, 70 ,10 ,30); 6 – В = (100, 110, 0, 0); 
в С = (0, 0, 0, 20); гр = (80, 80, 30 ,20) 


Определение этих операций рассмотрим на примере двух 
нечетких переменных ЕІ, Е2, которые заданы своими трапециевид- 
ными функциями принадлежности: ик (и) = <т[, п1, И, К>, 
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Ир2(и) = <т2, п2, 12, К2>. Результатом операций будет нечеткая пе- 


ременная К, параметры функции принадлежности которой опреде- 
ляются в соответствии с табл. 3.4. 
Таблица 3.4 
Основные арифметические операции над нечеткими переменными 
с трапециевидной функцией принадлежности 
Зависимости для вычисления параметров 
функции принадлежности 


Тип операции 


т = ті + т2; п=п1 + п2; 
1[=И- 12; к= К + 22 
т = ті - п2; п= п] - т2; 
[= П +0; к= КІ + 12 
т = т1*т2; п = п1*п2; 
Е= ЕІ * Е2 1= т1*т2 – (т1 - П)*(т2 - 12); 
к= (пі + К1)*(п2+к2) — п1*п2 
т = т1/п2; п= п1/т2; 
Е= РІ / Е2 [= (т1*К2 + п2*%*11) / (и2*п2+п2*К2); 
к= (т2%*К1 + п1*12) / (т2*т2 - т2*12) 


ЕЕ А2 


Е= ЕІ – Е2 


На основе приведенных описаний арифметических операций 
можно для рассматриваемого примера определить оценку бюджета с 
учетом долгов Т как сумму трех источников финансирования минус 
предполагаемые платы по кредиту. Причем результат будет также 
нечеткой переменной Т = А +В + С - р = (50+100-0 - 80, 70+110+0 - 
80, 10+0+0 + 20, 30-0-20 + 30) = (70, 100, 30, 80). Ее функция при- 
надлежности приведена рис. 3.15. 


ит(и) а 
о нь 


40 70 150 


О 


Рис. 3.15. Результирующее нечеткое описание бюджета 
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Таким образом, в бюджете может быть сумма от 40 до 180млн, 
но с наибольшей степенью уверенности можно говорить о суммах от 
70 до 100млн. 

Наряду с нечеткой переменной существует понятие лингвисти- 
ческой переменной. С ее помощью можно эффективно представлять 
вербальные описания некоторой количественной величины. Так, с их 
помощью можно описать качественную информацию об объекте 
принятия решений, представленную в словесной форме экспертами. 


3.6. Систематизация знаний на основе онтологий 


В настоящее время особую актуальность получает идея компью- 
теризации знаний о целых предметных областях для повышения ка- 
чества работы с программами за счет наделения их интеллектуаль- 
ными свойствами, а также создания условия для взаимодействия ав- 
тономных электронных агентов, выполняющих например, поиск ин- 
формации в компьютерных сетях. 

Центральной компонентой таких систем стали онтологии, соз- 
дание которых представляет собой методологию кодирования и пред- 
ставления декларативных знаний [3, 9]. 

Изначально термин «онтология» имел исключительно философ- 
скую основу, согласно которой онтология (филос.) — философское 
учение о бытии, его основах, принципах, структуре и закономерно- 
стях. И лишь в последнее время он был переосмыслен с позиций ин- 
форматики. Онтология (информ.) — набор определений (на формаль- 
ном языке) фрагмента декларативных знаний, ориентированный на 
совместное многократное использование различными пользователя- 
ми в своих приложениях. Из этого определения следует, что онтоло- 
гия включает в себя комплекс понятий от самых общих до наиболее 
конкретных, охватывающий полный спектр объектов и отношений, 
включая события и процессы, а также значения (атрибутов и отноше- 
ний), определяемые, если необходимо, во времени и пространстве. 
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Эта система объектов связывается как универсальными зависимостя- 
ми типа «общее-частное», «часть-целое», «причина-следствие» и т.п., 
так и специфическими для соответствующей предметной области. 
Другими словами, онтология — модель предметной области, исполь- 
зующая все допустимые средства представления знаний, релевантные 
для этой предметной области. 

Можно выделить следующие причины, когда возникает потреб- 
ность в создании онтологий: 

- совместное использование людьми или программными агента- 
ми общего понимания структуры информации; 

- повторное использование знаний в предметной области; 

- анализ знаний в предметной области; 

- для того чтобы сделать допущения в предметной области яв- 
НЫМ. 

Совместное использование людьми или программными 
агентами общего понимания структуры информации. Является 
одной из наиболее общих целей разработки онтологий. Так, пусть не- 
сколько различных Интернет-сайтов содержат информацию по меди- 
цине или предоставляют информацию о платных медицинских услу- 
гах, оплачиваемых через Интернет. Если эти Интернет-сайты совме- 
стно используют и публикуют одну и ту же базовую онтологию тер- 
минов, которыми они все пользуются, то компьютерные агенты могут 
извлекать информацию из этих различных сайтов и накапливать ее. 
Впоследствии агенты могут использовать накопленную информацию 
для ответов на запросы пользователей или как входные данные для 
других приложений. 

Обеспечение возможности использования знаний предмет- 
ной области. Подобное свойство онтологий позволяет формировать 
единую понятийную базу предметной области, которую в дальней- 
шем могут использовать как специалисты, так и информационные 
системы из других областей, а также интегрировать ее в другие при- 
кладные области для их расширения. 
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Создание явных допущений в предметной области. Дает воз- 
можность легко изменить эти допущения при изменении знаний о 
предметной области. Жесткое кодирование предположений о мире на 
языке программирования приводит к тому, что эти предположения не 
только сложно найти и понять, но и также сложно изменить, особен- 
но не программисту. Кроме того, явные спецификации знаний в 
предметной области полезны для новых пользователей, которые 
должны узнать значения терминов предметной области. 

Анализ знаний в предметной области. Возможен, когда име- 
ется декларативная спецификация терминов. Формальный анализ та- 
ких терминов ценен при попытке выявления соответствий между 
внешней информацией и понятиями предметной области, например, 
при компьютерном тестировании. 

Онтологии можно применять в качестве строительных блоков 
компонентов баз знаний, схемы объектов в объектно- 
ориентированных системах, концептуальной схемы баз данных, 
структурированного глоссария взаимодействующих сообществ, сло- 
варя для связи между агентами, определения классов для программ- 
ных систем. 

Важно отметить, что, как правило, создание онтологии предмет- 
ной области самой по себе не является главной целью. Разработка он- 
тологии напоминает процесс определения набора данных и их струк- 
туры для использования другими программами. 

Онтологии включают описание как очень общих, так и специ- 
фических для конкретной предметной области терминов и могут быть 
формализовано записаны как О = <Х, К, Е>, 

где Х – конечное, непустое множество понятий (терминов) 
предметной области; 

К – конечное множество отношений между понятиями 2; 

Е – конечное множество функций интерпретации, заданных на 
понятиях Хи (или) отношениях А. 

Для такой формализации онтологии возможны следующие част- 
ные случаи. 
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1. К = Ӧ, РЕ = 0. В этом случае онтология представляет собой 
простой словарь и ее практическое использование целесообразно в 
том случае, если термины принадлежат очень узкой предметной об- 
ласти и их смыслы уже заранее согласованы в пределах некоторого 
сообщества. Примером такой ситуации могут служить индексы поис- 
ковых машин сети Интернет. 

2. К = ©, Е + О. Здесь каждому элементу множества Х может 
быть поставлена соответствующая функция интерпретации. При этом 
часть таких интерпретирующих терминов задается процедурно, а не 
декларативно, то есть смыл терминов предметной области может ди- 
намически меняться в зависимости от перехода между прикладными 
областями. 

В общем случае (ХО, К = О, Е О) основной акцент в онтоло- 
гии делается на задание семантических отношений, имеющихся в 
предметной области вместе с созданием единой иерархии понятий, 
унификации терминов и правил их интерпретации. 

В настоящее время не существует единственного «правильного» 
способа разработки онтологии. Чаще всего используется итерацион- 
ный подход, когда, начиная с некоторого чернового варианта, онто- 
логия постепенно уточняется с добавлением к ней новых деталей. В 
общем случае процесс создания онтологии включает рассмотрение 
следующих вопросов. 

1. Обозначение целей и области применения создаваемой онто- 
логии. Для этого необходимо определить, для чего создается онтоло- 
гия и как она будет в дальнейшем использоваться. 

2. Построение онтологии 

Фиксирование знаний о предметной области, которое включает: 

- определение основных понятий и их взаимоотношений в вы- 
бранной предметной области; 

- создание точных непротиворечивых определений для каждого 
основного понятия и отношения; 

- определение терминов, которые связаны с этими терминами и 
отношениями; 

- окончательное согласование всех названных этапов. 
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Кодирование, которое подразумевает: 

- разделение совокупности основных терминов, используемых в 
онтологии, на отдельные классы понятий; 

- выбор или разработку специального языка для представления 
онтологии; 

- непосредственно задание фиксированной концептуализации на 
выбранном языке представления знаний. 

Как методология инженерии знаний информация в онтологии, 
как правило, представляется в виде семантической или фреймовой 
сети. При таком описании узлами сети являются понятия предметной 
области, а дуги определяют их отношения. Для конкретизации таких 
понятий они организовываются в иерархию классов, правила проек- 
тирования которой близки к технологии объектно-ориентированного 
программирования. Отличие состоит в том, что объектно- 
ориентированное программирование сосредоточивается главным об- 
разом на операторных свойствах класса, тогда как разработчик онто- 
логии принимает решения, основываясь на структурных свойствах 
класса. 

Для описания классов онтологии используются фреймы, пред- 
ставляющие собой именованную структуру данных, состоящую из 
слотов, с помощью которых описываются свойства понятий для их 
конкретизации. 

Процесс создания онтологии как способ моделирования пред- 
метной области является очень трудоемким и предполагает в зависи- 
мости от субъективного мнения эксперта множество альтернатив ее 
вариантов. В связи с этим важным является автоматизация проекти- 
рования и систематизация уже созданных онтологий в электронном 
виде с помощью существующего программного обеспечения. 

Сейчас можно выделить несколько программных сред разработ- 
ки онтологий, наиболее популярной из которых является «Ргоѓёсё» 
(ћер://ргоѓере.ѕапѓога.ейи). Кроме этого, для целого ряда областей 
уже существует опыт разработки онтологий, которые могут исполь- 
зоваться экспертами по предметным областям для совместного ис- 
пользования и аннотирования информации в своей области. Так, он- 
тологии в области медицины доступны в электронном виде и могут 
быть интегрированы в используемые интеллектуальные системы. 
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В качестве примера рассмотрим фрагмент процедуры создания 
онтологии для предметной области «Искусственный интеллект». 
Процесс проектирования онтологии будет включать: 

- определение классов в предметной области; 

- расположение классов в таксономическую иерархию; 

- определение слотов и описание допустимых значений этих 
слотов; 

- заполнение слотов значениями. 

Существует несколько подходов к разработке иерархии классов, 
наиболее распространенный из которых — нисходящее проектирова- 
ние, оно начинается с определения самых общих понятий предметной 
области с последующей их конкретизацией. 

В соответствии с этим для заданной предметной области были 
определены следующие классы для наиболее общих понятий: «Тех- 
нологии искусственного интеллекта», «Интеллектуальные системы», 
«Программное обеспечение», «Области применения», «Источники 
информации» (рис. 3.16). 


Представление и обработка знаний 


Эвристическое программирование 
Деревья решений 
Нечеткие множества 
Искусственные нейронные сети 
Эволюционное моделирование 
«Добыча» и анализ данных 
Когнитивная графика 

`—— Комбинированные технологии 


ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ 


ОБЛАСТИ ПРИМЕНЕНИЯ 
ИСТОЧНИКИ ИНФОРМАЦИИ 


Образование 
Наука 
Производство 
Бизнес 


Учебные издания 
Научные издания 


Популярные издания 


Рис. 3.16. Таксономия классов понятий предметной области 
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Далее каждый из классов был уточнен множеством подклассов, 
например «Интеллектуальные системы» до «Экспертные системы», 
«Системы анализа естественного языка», «Системы обработки есте- 
ственного языка», «Системы анализа изображений» и др. На рис. 3.17 
показаны различные уровни таксономии понятия «Интеллектуальные 
системы». 


БА! Ргоёёдеё 3.1.1 (е: С: Ргодғгато%о20Е1еѕ\Ргоеде 3.1\АІ.рргј, ОМІ ЕЙе$ (.омі ог „гЧР)) 
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Рог Ргојесі: @ А! 


ГЕЯ ГУ 
АззеЦей Ніегагсіту % $? е. Е 


омм: Тіто 


Интеллектуальные системы 


Ф нструментальные_ средства создания интеллектуальных модулей _и_систем 


01 Интеллектуальные роботы 
@ интеллектуальные системы проектирования 
@® информационно-поисковые_системы 
Ф компьютерные системы обработки _естественного_языка 
ё Обучающие системы 
Г) Системы _анализа изображений 
у Ф  системы_анализа _речи 
@ системы_голосового_управления 
Ф системы_синтеза_речи 
@ системы_управления_речевым_диалогом 
т Фосистемы интеллектуального_анализа_данных 
& Комбинированные_сиситемы 
® Системы_когнитивной_гпафики 
Г? Системы основанные на ДОМ __ методе 
Ф системы_основанные_на_нейросетевых_технологиях 


Ф системы эволюционного моделирования 


Рис. 3.17. Таксономия одного класса понятий предметной области, 
построенная в системе «Рго{е2е» 


Для уменьшения информационной избыточности онтологии 
реализуется принцип наследования информации, позволяющей об- 
щую (глобальную для онтологии) информацию хранить в отдельном 
родительском фрейме, а во всех остальных фреймах указывать ссыл- 
ку на место хранения этой информации. 
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Для дальнейшего уточнения понятий должна быть описана 
внутренняя структура классов через заполнение соответствующих 
слотов. Для этих целей был определен список терминов, связанных с 
каждым из понятий и образующих тезаурус или словарь предметной 
области. На рис. 3.18 показаны слоты класса «Система нейросетевого 
моделирования» 


АІ.рргј, ОМІ ЕЙе$ (.омі ог .г9Р)) == хі 
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Свойства программного обеспечения, использующего 
искусственные нейронные сети 


Авкейеа | Ітѓеғғео | ШИ Ргорегіїеє й № т. щ. є ® 


ШИ Максимальная_мошность_нейронной_сети 
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Поддерживаемые алгоритмы обучения 
НЕСЕЗЗАА\ & $ЈЕРІСІЕМТ ШЕ Поддер Е Р -95у 


ЧЕСЕЅЅАБҮ 
Ф системы интеллектуального_анализа_данных[ Е] 


ШИ Поддерживаемые _модели нейронных сетей 
Ш Поддерживаемые модели _обучения 
Ш Поддерживаемые форматы входных _и_выходных 


Рис. 3.18. Уточнение понятия предметной области 
через заполнение слотов класса 


Как следует из экранной формы, для каждого слота должны 
быть заданы тип и возможны диапазон значений, которые он может 
содержать. Основными типами значений являются строка, число, ло- 
гическое значение, перечисление. 

Последним этапом является создание отдельных экземпляров 
классов (объектов) в иерархии. Для определения такого экземпляра 
класса необходимо выбрать класс, создать объект и ввести значения 
слотов, например создадим объект «Система нейросетевого модели- 
рования» для класса «Интеллектуальные системы» (рис. 3.19). 
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Ограничена ресурсами ЭВМ п С учителем 
Без учителя 


Смешанная 


Поддерживаеные_алгорит ртх Поддерживаеные_нодели. № = х 
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Сеть Хопфилда 5ігіпа 


Рис. 3.19. Создание объекта класса 


Впоследствии созданная онтология может быть использована 
как при обработке естественного языка электронных документов, по- 
священных данной предметной области, так и для интеллектуализа- 
ции работы поисковых систем, например в сети Интернет. 

Таким образом, создание онтологий является перспективной 
технологией управления информацией о предметной области. Ее ис- 
пользование представляет собой подход к структуризации и система- 
тизации знаний, в частности, для повышения интеллектуальности 
информационно-поисковых систем. В то же время отсутствие унифи- 
цированных правил формирования онтологий приводит к тому, что 
проектирование онтологий становится исключительно творческой 
процедурой, зависящей от множества субъективных факторов ее раз- 
работчика. Следствиями этого является появление проблемы логиче- 
ской верности построенных онтологий, а также ограниченные воз- 
можности применения онтологий в качестве универсального средства 
описания декларативных знаний предметной области. 
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Контрольные вопросы 


1. В чем смысл понятия «знания» с точки зрения их использова- 
ния в интеллектуальных системах? 

2. Какие существуют основные модели представления знаний? 

3. В чем заключаются особенности логической модели пред- 
ставления знаний? 

4. Какие основные правила вывода применяются в исчислении 
высказываний (предикатов)? 

5. В чем заключается представление знаний на основе 
семантической сети? 

6. Опишите фрагмент выбранной предметной области 
(ситуации) в виде семантической сети. 

7. Каковы особенности фреймовой модели представления зна- 
ний? Приведите пример ее использования для описания знаний пред- 
метной области. 

8. Каковы особенности продукционной модели представления 
знаний? Приведите примеры задач, решаемых с помощью продукци- 
онных систем. 

9. Каковы отличия нечетких множеств от обычных? 
Назовите компоненты нечеткого множества. 

10. Какие операции можно выполнять над нечеткими множест- 
вами? Приведите примеры их использования. 

11. Дайте определения понятиям «нечеткое отношение», «не- 
четкая переменная». Приведите примеры решения задач с их исполь- 
зованием. 

12. Дайте определение понятию «онтология». Как они применя- 
ются для систематизации знаний? 
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4. ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ 


Одним из наиболее перспективных современных направлений в 
области искусственного интеллекта является попытка смоделировать 
мыслительные процессы человека. При этом за основу берутся дос- 
тижения не в области информатики и математического моделирова- 
ния, а результаты исследования процессов функционирования нерв- 
ной системы человека. В то же время знания о работе мозга столь ог- 
раничены, что при разработке искусственных нейронных сетей 
(ИНС) приходится выходить за пределы современных биологических 
знаний в поисках структур, способных выполнять полезные функции. 
Несмотря на то, что связь с биологией слаба, искусственные нейрон- 
ные сети продолжают сравниваться с мозгом. Их функционирование 
часто напоминает человеческое познание, поэтому трудно избежать 
этой аналогии. 


4.1. Возможности искусственных нейронных сетей 


Нервная система человека, построенная из элементов, называе- 
мых нейронами, имеет огромную сложность. Около 10'' нейронов 
участвуют в примерно 10'° передающих связях, имеющих длину метр 
и более. Каждый нейрон обладает многими качествами, общими с 
другими элементами тела, но его уникальной способностью являются 
прием, обработка и передача электрохимических сигналов по нерв- 
ным путям, которые образуют коммуникационную систему мозга. 

На рис. 4.1 показана структура биологического нейрона. Каж- 
дый нейрон имеет отростки нервных волокон двух типов — дендриты, 
по которым принимаются импульсы, и единственный аксон, по кото- 
рому нейрон может передавать импульс. 

Дендриты идут от тела нервной клетки к другим нейронам, где 
они принимают сигналы в точках соединения, называемых синапса- 
ми. Принятые синапсом входные сигналы подводятся к телу нейрона. 
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Импульсы, поступившие к нейрону одновременно по нескольким 
дендритам, суммируются. Если суммарный импульс превышает неко- 
торый порог, нейрон возбуждается, формирует собственный импульс 
и передает его далее по аксону другим нейронам. 

У этой основной функциональной схемы много усложнений и 
исключений, тем не менее большинство искусственных нейронных 
сетей моделируют лишь эти простые свойства. 


дендриты 


аксоны 


тело нейрона 


синапсы движение импульса 


Рис. 4.1. Биологический нейрон 


Таким образом, ИНС является приближенной электронной мо- 
делью нейронной структуры головного мозга. Известно, что принцип 
работы мозга отличается от вычислительной работы современных 
компьютеров с архитектурой фон Неймана, поскольку главным обра- 
зом связан с процессами обучения на приобретаемом опыте. Поэтому 
применение нейронных сетей часто дает выигрыш в тех задачах, где 
применение традиционных подходов к их решению проблематично. 

В то же время нейросети нельзя считать универсальным инст- 
рументом для решения всех вычислительных проблем. Традицион- 
ные компьютеры и вычислительные методы часто являются идеаль- 
ными для многих применений. Современные цифровые вычисли- 
тельные машины превосходят человека по способности производить 
числовые и символьные вычисления. Однако, изменив вычислитель- 
ный характер задачи на восприятие внешней информации (например, 
узнавание человека в толпе по его лицу), можно убедиться в 
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обратном, когда свойственное мозгу естественное мышление в виде 
сложных образов позволяет решить подобную задачу с высокой ско- 


ростью и абсолютной точностью [5]. 
Такие преимущества ИНС могут быть объяснены наличием у 
них ряда качеств, которыми не обладают компьютеры с традицион- 


ной архитектурой: 


- распределенное представление информации и параллельные 


вычисления, 


- способность к обучению и обобщению; 

- адаптивность и самоорганизуемость; 

- толерантность к ошибкам; 

- низкое энергопотребление. 

В свою очередь, реализация ИНС на аппаратном уровне, то есть 
в виде нейрокомпьютера, обладающего отмеченными выше особен- 
ностями, приведет к существенным изменениям большинства харак- 
теристик, свойственных традиционным компьютерам (табл. 4.1). 


Таблица 4.1 


Сравнение компьютера на основе архитектуры фон Неймана 


с нейрокомпьютером 


Характеристика Традиционный Нейрокомпьютер 
компьютер 
Сложный Простой 
Процессор Высокоскоростной Низкоскоростной 
Один или несколько Большое количество 
Отдельно от процессора | В процессоре 
Память Локальная Распределенная 
Адресация по адресу Адресация по смыслу 
Централизованные Распределенные 
Вычисления Последовательные Параллельные 
Алгоритмические Самообучение 
Надежность Уязвимость Живучесть 
Специализация Числовые операции Проблемы восприятия 


Среда функционирования 


Строго ограниченная 


Без ограничений 


Метод обучения 


По правилам 


По примерам 


Применение 


Числовая обработка ин- 
формации 


Распознавание, класси- 
фикация, управление на 
основе образов 
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Как видно из табл. 4.1, нейрокомпьютер в сравнении с машиной 
фон Неймана имеет принципиально другой способ организации вы- 
числительного процесса: он не программируется с использованием 
явных правил и кодов в соответствии с заданным алгоритмом, а обу- 
чается. 

Актуальность исследований в этом направлении подтверждается 
массой различных применений НС. Опыт использования ИНС пока- 
зал их эффективность в таких задачах, как прогнозирование, распо- 
знавание, классификация, аппроксимация функций, адаптивное 
управление, сжатие данных и др. [1, 5, 13]. 


4.2. Искусственный нейрон 


В качестве научного направления ИНС впервые заявили о себе в 
40-е годы 20 в. и связывают это с работами ученых Маккалока и Пит- 
тса. Стремясь воспроизвести функции человеческого мозга, исследо- 
ватели создали простые программные модели биологического нейро- 
на и системы его соединений. 

Основу любой ИНС составляют отдельные элементы (ячейки), 
имитирующие работу нейронов мозга — искусственные нейроны. Ка- 
ждый нейрон характеризуется своим текущим состоянием по анало- 
гии с нервными клетками головного мозга, которые могут быть воз- 
буждены или заторможены. Он обладает группой синапсов — однона- 
правленных входных связей, соединенных с выходами других нейро- 
нов, а также имеет аксон — выходную связь данного нейрона, с кото- 
рой сигнал (возбуждения или торможения) поступает на синапсы 
следующих нейронов. На рис. 4.2 представлен общий вид нейрона. 
Здесь множество входных сигналов, обозначенных ху, х›,...,х,, посту- 
пает на искусственный нейрон. Эти входные сигналы, в совокупности 
обозначенные вектором ХЖ, соответствуют сигналам, приходящим в 
синапсы биологического нейрона [13]. 
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Входы Синапсы 


м Ячейка 
1 СЯ 
нейрона 


Аксон Выход 


п 1=1 


Рис. 4.2. Искусственный нейрон 


Каждый сигнал характеризуется величиной синаптической связи 
или ее весом у, , который по физическому смыслу эквивалентен элек- 
трической проводимости. Множество весов в совокупности обознача- 
ется вектором И. Суммирующий блок $, соответствующий телу био- 
логического элемента, алгебраически складывает взвешенные входы, 
определяя текущее состояние нейрона. 
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В некоторых приложениях ИНС могут быть эффективно ис- 
пользованы другие формулы нахождения взвешенной суммы весов 
нейрона, например (4.2, 4.3). 


2 
у= Уху; (4.2) 


==) х, ХЕ) тоал) ° И”. (4.3) 
1 


Введение такого рода нелинейности в целом увеличивает вы- 
числительную мощь сети, то есть позволяет из меньшего числа ней- 
ронов с «нелинейными» синапсами сконструировать ИНС, выпол- 
няющую работу обычной ИНС с большим числом стандартных ней- 
ронов и более сложной конфигурации. 

Далее для определения значения выхода нейрона его состояние 
преобразуется с помощью активационной функции Г. На рис. 4.3 
представлены различные виды такой функции. 
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У У 
1 1 
Хх Хх 
от 0 
а) 6) 


у 
1 1 
Хх 
-1 0 Хх 
в) Г) 


Рис. 4.3. Виды активационной функции: 
а - функция единичного скачка; б - линейный порог (гистерезис); 
в - сигмоид — гиперболический тангенс; г - сигмоид — формула (4.4) 


Одной из наиболее распространенных является нелинейная 
функция с насыщением, так называемый сигмоид (т.е. функция $- 
образного вида). 


1 
= (4.4) 
1+е 


При уменьшении © сигмоид становится более пологим, в преде- 
ле при а = 0, вырождаясь в горизонтальную линию на уровне 0,5, при 
увеличении @ сигмоид приближается по внешнему виду к функции 
единичного скачка с порогом Т в точке х = 0. Из выражения для сиг- 
моида очевидно, что выходное значение нейрона лежит в диапазоне 
[0,1]. Одно из ценных свойств сигмоидной функции — простое выра- 
жение для ее производной, применение которого будет рассмотрено в 
дальнейшем. 

Л'(х) = а: 3 (х)(1- Л(х)). 

Следует отметить, что сигмоидная функция дифференцируема 
на всей оси абсцисс, что используется в некоторых алгоритмах обу- 
чения. Кроме того, она обладает свойством усиливать слабые сигна- 
лы лучше, чем большие и предотвращает насыщение от больших сиг- 
налов, так как они соответствуют областям аргументов, где сигмоид 
имеет пологий наклон. 
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При создании бинарных ИНС, которые оперируют двоичными 
сигналами, и выход каждого нейрона может принимать только два 
значения: логический ноль и логическая единица, часто используется 
функция единичного скачка. Такая функция имеет два возможных 
значения: 0, если $ меньше порога Т и 1 - в противном случае. Если 
же выходные значение нейрона могут принимать непрерывные зна- 
чения (аналоговая ИНС), то в качестве активационной функции ис- 
пользуется уже сигмоид [13]. 

В целом же выбор функции определяется характером решаемых 
задач, а также видом нейронной сети. В настоящее время существует 
множество разновидностей ИНС, которые можно классифицировать 
по следующим признакам: 

- тип входной информации (аналоговые и двоичные). 

- характер обучения (с учителем и без). 

- характер настройки синапсов (фиксированные и динамические 
связи). 

- метод обучения (обратное распространение, конкурентное 
обучение, правило Хебба, гибридные методы). 

- характер связей (прямое и прямо-обратное распространение 
информации). 

- архитектура: персептроны, самоорганизующиеся ИНС (Кохо- 
нена), ИНС с обратными связями (Хэмминга, Хопфилда, двунаправ- 
ленная ассоциативная память), гибридные ИНС (встречного распро- 
странения). 

Рассмотренная ранее простая модель искусственного нейрона 
игнорирует многие свойства своего биологического двойника. Так, 
она не принимает во внимание задержки во времени, которые воздей- 
ствуют на динамику системы. Поэтому наиболее полно свойства био- 
логической системы удается смоделировать при соединении нейро- 
нов в слои, а те в свою очередь – в нейронные сети. 

Простейшая сеть состоит из группы нейронов, образующих слой 
(рис. 4.4). Такая система называется персептрон, или однослойный 
персептрон [5]. 
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Рис. 4.4. Однослойный персептрон 


Как следует из рис. 4.4, каждый элемент из множества входов Х от- 
дельным весом соединен с каждым искусственным нейроном. На п 
входов поступают некие сигналы, проходящие по синапсам на три 
нейрона, образующие единственный слой этой ИНС и выдающие три 
выходных сигнала 


п 
у;=} Ух, м , 
і=1 


где ј = 1..3. 

Очевидно, что все весовые коэффициенты синапсов одного слоя 
нейронов можно свести в матрицу /, в которой каждый элемент у; 
задает величину і-й синаптической связи /-го нейрона. Таким обра- 
зом, процесс, происходящий в ИНС, может быть записан в матричной 
форме: 

Ү = ЕХЮ), 

где Х, У- соответственно входной и выходной сигнальные век- 
торы. 

Подобная сеть с тремя нейронами может быть использована для 
решения задачи распознавания восьми объектов. Для этого использу- 
ется активационная функция в виде единичного скачка, принимаю- 
щая значения 0 или 1. Каждая комбинация нулей и единиц будет со- 
ответствовать определенному объекту. Для примера рассмотрим за- 
дачу распознавания буквы алфавита. Цель состоит в том, чтобы ИНС 
смогла определять букву по входному образу даже если информация 
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в нем содержит помехи. На рис. 4.5 показана структура нейронной 
сети для этой задачи [13]. 


Рис. 4.5. Персептронная система распознавания изображений 


Допустим , что входные образы нанесены на карты. Каждая кар- 
та разбита на квадраты, и от каждого квадрата на персептрон подает- 
ся вход. Если через квадрат проходит линия, то соответствующий 
нейронный вход равен единице, в противном случае он равен нулю. 
Выход может быть двоичным кодом или числом, представляющим 
определенную букву. 

В качестве другого примера приведем задачу прогнозирования, 
которая также может быть успешно решена с помощью ИНС. Поста- 
новка задачи заключалась в предсказании победы правящей или оп- 
позиционной партии на основе ответов на 12 вопросов. Ниже приво- 
дится список таких вопросов. 

1. Правящая партия была у власти более одного срока? 

2. Правящая партия получила больше 50% голосов на прошлых 
выборах? 

3. В год выборов была активна третья партия? 

4. Была серьезная конкуренция при выдвижении от правящей 
партии? 
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5. Кандидат от правящей партии был президентом в год выбо- 
ров? 

6. Был ли год выборов временем спада или депрессии? 

7. Был ли рост среднего национального валового продукта на 
душу населения больше 2.1%? 

8. Произвел ли правящий президент существенные изменения в 
политике? 

9. Во время правления были существенные социальные волне- 
ния? 

10. Администрация правящей партии виновна в серьезной 
ошибке или скандале? 

11. Кандидат от правящей партии — национальный герой? 

12. Кандидат от оппозиционной партии — национальный герой? 

Ответы на вопросы описывают ситуацию на момент, предшест- 
вующий выборам. Ответы кодировались следующим образом: «да» - 
единица, «нет» - минус единица. Отрицательный сигнал на выходе 
сети интерпретируется как предсказание победы правящей партии. В 
противном случае ответом считается победа оппозиционной партии. 
Все нейроны реализуют пороговую функцию, равную единице, если 
алгебраическая сумма входных сигналов нейрона больше либо равна 
нулю, и минус единица при сумме меньшей нуля. 

Отметим, что представление входной информации в виде ком- 
бинаций нулей и единиц является достаточно удобным для обучения 
нейросети. однако это не всегда возможно, особенно в случае, если 
элементы входных сигналов принадлежат разным типам данных или 
интервалы значений входных данных существенно различаются. 

Для того чтобы сеть в процессе своей работы выдавала правиль- 
ный результат, нужно определить значения весов ее синаптических 
связей. Эта задача является одной из самых сложных наряду с опре- 
делением топологии сети. 

Для настройки ИНС, то есть определения весов связей исполь- 
зуются специализированные алгоритмы обучения. Способность ИНС 
обучаться является, пожалуй, самым ярким их свойством. Впервые 
такая возможность была доказана Розенблатом. Цель обучения сети 
заключается в том, чтобы для некоторого множества входов она 
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могла выдавать желаемое (или, по крайней мере, близкое к нему) 
множество выходов. Каждое такое входное (или выходное) множест- 
во рассматривается как вектор. Обучение ведется путем последова- 
тельного предъявления входных векторов с одновременной под- 
стройкой весов в соответствии с определенной процедурой. В про- 
цессе обучения веса сети постепенно становятся такими, чтобы каж- 
дый входной вектор вырабатывал выходной вектор. 

Различают две основные группы алгоритмов обучения: с учите- 
лем и без учителя. 

Обучение с учителем предполагает, что для каждого входного 
вектора существует целевой вектор, представляющий собой требуе- 
мый выход. Вместе они называются обучающей парой. Обычно сеть 
обучается на некотором числе таких обучающих пар. Предъявляется 
выходной вектор, вычисляется выход сети и сравнивается с соответ- 
ствующим целевым вектором, разность (ошибка) с помощью обрат- 
ной связи подается в сеть и веса изменяются в соответствии с алго- 
ритмом, стремящимся минимизировать ошибку. Векторы обучающе- 
го множества предъявляются последовательно, вычисляются ошибки 
и веса подстраиваются для каждого вектора до тех пор, пока ошибка 
по всему обучающему массиву не достигнет приемлемо низкого 
уровня. 

Несмотря на многочисленные прикладные достижения, обуче- 
ние с учителем критиковалось за свою биологическую неправдопо- 
добность. Трудно вообразить обучающий механизм в мозге, который 
бы сравнивал желаемые и действительные значения выходов, выпол- 
няя коррекцию с помощью обратной связи. Если допустить подобный 
механизм в мозге, то откуда тогда возникают желаемые выходы? 
Обучение без учителя является намного более правдоподобной моде- 
лью обучения в биологической системе. Развитая Кохоненом и мно- 
гими другими, она не нуждается в целевом векторе для выходов и, 
следовательно, не требует сравнения с предопределенными идеаль- 
ными ответами. Обучающее множество состоит лишь из входных 
векторов. Обучающий алгоритм подстраивает веса сети так, чтобы 
получались согласованные выходные векторы, то есть чтобы предъ- 
явление достаточно близких входных векторов давало одинаковые 


107 


выходы. Процесс обучения выделяет статистические свойства обу- 
чающего множества и группирует сходные векторы в классы. Предъ- 
явление на вход вектора из данного класса даст определенный вы- 
ходной вектор, но до обучения невозможно предсказать, какой выход 
будет производиться данным классом входных векторов. Выходы та- 
кой сети должны трансформироваться в форму, по которой можно 
идентифицировать связь между входом и выходом, установленную 
сетью [5]. 

Кроме этого, алгоритмы обучения могут разделяться на детер- 
минированные и стохастические. В первом случае подстройка весов 
представляет собой жесткую последовательность действий, во втором 
— она производится на основе действий, подчиняющихся некоторому 
случайному процессу. 

Для задач прогнозирования и распознавания, как правило, ис- 
пользуется алгоритм обучения с учителем, который состоит из сле- 
дующих шагов. 

1. Проинициализировать элементы весовой матрицы (обычно 
небольшими случайными значениями). 

2. Подать на входы один из входных векторов, которые сеть 
должна научиться различать, и вычислить ее выход. 

3. Если выход правильный, перейти на шаг 4. 

Иначе вычислить разницу между эталонным и полученным зна- 
чениями выхода 

б=7-ТУ 
Модифицировать веса в соответствии с формулой 
и, @а+) = и; (О +у-0-х,, 

где Е, +1 — номера соответственно текущей и следующей итера- 
ций; у – коэффициент скорости обучения, 0 <у< 1 (ум = 0,6 .. 0,8); 1 
— номер входа; / — номер нейрона в слое. 

Очевидно, что, если Ү; > У весовые коэффициенты будут увели- 
чены, и они уменьшат ошибку. В противном случае они будут умень- 
шены, и Утоже уменьшится, приближаясь к Ү. 

Коррекция весов с использованием коэффициента различия (0) 
между требуемым и реальным выходом называется дельта-правилом. 
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4. Цикл с шага 2, пока сеть не перестанет ошибаться. 

На втором шаге на разных итерациях поочередно в случайном 
порядке предъявляются все возможные входные вектора. К сожале- 
нию, нельзя заранее определить число итераций, которые потребуется 
выполнить, а в некоторых случаях и гарантировать полный успех. 

Итак, работа всех ИНС сводится к классификации (обобщению) 
входных сигналов, принадлежащих и - мерному гиперпространству, 
по некоторому числу классов. С математической точки зрения это 
происходит путем разбиения гиперпространства гиперплоскостями. 
Для однослойного перцептрона такая плоскость может быть выраже- 
на как 


Г) 
Ух; их = Т, к= 1...т 
і=1 


Каждая полученная область является областью определения от- 
дельного класса. Число таких классов для одной НС перцептронного 
типа не превышает 2", где т — число выходов сети. 

Однако не все задачи ИНС могут быть ею решены. Так, одно- 
слойный перцептрон, состоящий из одного нейрона с двумя входами 
(рис. 4.6) не способен воспроизвести такую функцию как «исклю- 
чающее или» (эта задача известна как проблема «исключающее 
ИЛИ») [13]. Рассмотрим ее подробнее. 


Рис. 4.6. Перцептрон для задачи «исключающее ИЛИ» 


Все возможные комбинации сигналов на входах х; , х; будут со- 
стоять из четырех точек на плоскости х! – х› (рис. 4.7). Так, точка х! = 
0 иу2 = 0 обозначена на рисунке как точка Ад. 
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Рис. 4.7. Задача «исключающее ИЛИ» 


В табл. 4.2 приведены требуемые связи между входами и выхо- 
дом, где входные комбинации, которые должны давать нулевой вы- 
ход, помечены Аџи А}, единичный выход – Вои В). 


Таблица 4.2 
Таблица истинности для функции исключающее ИЛИ 
Требуемый 
Точки Значения ху Значения х› 
выход 
Ао 0 0 0 
Во 1 0 1 
В; 0 1 1 
А 1 1 0 


В качестве активационной функции используется сети порого- 
вая функция, где У принимает значение ноль, когда 5 меньше 0,5, и 
единица в случае, когда 5 больше или равно 0,5. Нейрон выполняет 
следующее вычисление: 
5 = хил + ХИ». 


Никакая комбинация значений двух весов не может дать соот- 
ношения между входом и выходом, задаваемого табл. 4.2. Чтобы по- 
нять это ограничение, зафиксируем $ на величине порога 0,5. Сеть в 
этом случае описывается уравнением (4.5). Это уравнение линейно по 
хи х, то есть все значения по х! и х›, удовлетворяющие этому урав- 
нению, будут лежать на некоторой прямой в плоскости х} — х›. 

Хт + ХМ) = 0,5 (4.5) 
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Любые входные значения для х; и хз на этой линии будут давать 
пороговое значение 0,5 для 5. Входные значения с одной стороны 
прямой обеспечат значения 5 больше порога, следовательно, Ү = 1. 
Входные значения по другую сторону прямой обеспечат значения 5 
меньше порогового значения, делая У равным 0. Изменения значений 
у, мә и порога будут менять наклон и положение прямой. Для того 
чтобы сеть реализовала функцию исключающее ИЛИ, заданную 
табл. 4.2, нужно расположить прямую так, чтобы точки А были с од- 
ной стороны прямой, а точки В — с другой. Попытавшись нарисовать 
такую прямую на рис. 4.7, можно убедится, что это невозможно. Это 
означает, что какие бы значения ни приписывались весам и порогу, 
сеть неспособна воспроизвести соотношение между входом и выхо- 
дом, требуемое для представления функции исключающее ИЛИ. 

Функции, которые не реализуются однослойной сетью, называ- 
ются линейно неразделимыми. Решение задач, подпадающих под это 
ограничение, заключается в применении 2-х и более слойных сетей 
или сетей с нелинейными синапсами, однако и тогда существует ве- 
роятность, что корректное разделение некоторых входных сигналов 
на классы невозможно. 


4.3. Многослойные нейронные сети 


Одной из главных особенностей ИНС является параллельный 
характер ее работы. Это достигается путем объединения большого 
числа нейронов в слои и соединения определенным образом нейро- 
нов различных слоев. При этом обработка взаимодействия всех ней- 
ронов ведется послойно. 

Теоретически число слоев и число нейронов в каждом слое мо- 
жет быть произвольным, однако фактически оно ограничено ресур- 
сами компьютера или специализированной микросхемы, на которых 
реализуется ИНС. Чем сложнее ИНС, тем более сложные задачи она 
может решать. Так, с помощью многослойной ИНС с двумя перера- 
батывающими слоями можно с любой точностью аппроксимировать 
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любую многомерную функцию на отрезке [0:1], что следует из тео- 
ремы Колмогорова, утверждающей, что любую непрерывную много- 
мерную функцию на единичном отрезке [0;1] можно представить в 
виде конечного числа одномерных. 

Замечание. Отмеченная теорема имеет свой вариант, предло- 
женный Хехт-Нильсоном в терминах нейросетей: функция многих 
переменных достаточно общего вида может быть представлена с по- 
мощью двухслойной нейронной сети с прямыми полными связями с и 
компонентами входного сигнала, 2т+1 компонентами первого 
(«скрытого» слоя) с заранее известными ограниченными функциями 
активации (например, сигмоидальными) и т компонентами второго 
слоя с неизвестными функциями активации. Данная теорема позволя- 
ет получить доказательство решаемости задачи представления функ- 
ции достаточно произвольного вида на ИНС, а также указание для за- 
дач этого типа минимальных значений числа нейронов сети, необхо- 
димых их решения. 

Ранее был приведен алгоритм обучения однослойной ИНС, ко- 
гда подстройка синаптических связей идет в направлении, минимизи- 
рующем ошибку на выходе сети. В многослойных же ИНС идеальные 
выходные значения нейронов всех слоев, кроме последнего, как пра- 
вило, не известны и такую сеть уже невозможно обучить, руково- 
дствуясь только величинами ошибки на выходах ИНС. Один из вари- 
антов решения этой проблемы — разработка выходных сигналов, со- 
ответствующих входным, для каждого слоя ИНС, что является очень 
трудоемкой операцией и не всегда возможно. 

Поэтому для обучения многослойной ИНС используется проце- 
дура, известная как метод обратного распространения ошибки. Мате- 
матическое обоснование этого метода строится на оптимизационном 
методе градиентного спуска, задача которого в этом случае заключа- 
ется в минимизации ошибки сети. 

Данный метод обучения применим к ИНС с любым числом сло- 
ев. Далее для простоты будет рассматриваться двухслойная нейрон- 
ная сеть (рис. 4.8), которая включает входной, скрытый и выходной 
слои, также будем считать, что число нейронов в слоях одинаковое. 
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Входной Скрытый Выходной 
слой слой слои Желаемый 
сигнал 1 


х1 


Желаемый 
сигнал 2 
х2 


Желаемый 
сигнал п 
ХПА 


Ошибка п 


Рис. 4.8. Нейронная сеть для задачи обучения многослойных ИНС 


В работе процедуры обратного распространения ошибки можно 
выделить два основной этапа: проход вперед и обратный проход. 

Проход вперед. Сети последовательно подаются на вход векто- 
ра Х из обучающего множества, для каждого из которых определяет- 
ся выходной вектор Ү. Обработка происходит послойно, то есть мно- 
жество выходов предыдущего слоя является входами для следующе- 
го. В векторном виде этот процесс можно записать как 

у= Е(Х!ү!), 1=1.. М. 

где М — число слоев; 

И – матрица весов между нейронами слоя /; 

Ху! - текущее состояние нейронов слоя (8') в векторной 
форме; 

Үс вектор значений выходов слоя /, является входом (Ү СЭ ыы 
для слоя [+1. 

Важно отметить, что активационная функция Е должна выби- 
раться с учетом требования ее дифференцируемости на всей области 
определения. Поэтому в качестве такой функции часто используется 
сигмоид. 

Обратный проход 

1. С помощью модифицированного дельта — правила (4.6) кор- 
ректируются веса выходного слоя (4.7, 4.8) 

д” = (Ү" –4")Е"(5"), (4.6) 
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где д” - величина ошибки (коэффициент коррекции веса) в век- 
торной форме для слоя т; 

Ч” - вектор эталонных выходных значений нейронов слоя т. 

Ди" = ут! = 1.0, = 1. п, (4.7) 

где и – число нейронов в слое; 

Диу" у - изменение веса между і – ми / – м нейроном слоев т-1 и 
т соответственно; 

Ой - коэффициент коррекции веса слоя т нейрона /; 


—1 ы И 
У; - значение выхода нейрона Г, слоя т-1. 


1 


1 1 
ИЕН АИ, у (4.8) 


2. По формулам (4.9, 4.10) рассчитываются соответственно д Ги 
Ди’ для всех остальных слоев, / = 1..т-1. 


п 
і ' 
8 = 36 |. О). (4.9) 
и 


Согласно этой формуле, ошибка предыдущего слоя определяет- 
ся рекурсивно через ошибку следующего. 

3. Корректируются все веса в ИНС на основе (4.8). 

4. Определяется среднеквадратичная ошибка как разница между 
эталонным и выходным вектором 


Р 
2 
Е =: 01 4.) , 
р= 


где Р — число образов для обучения ИНС; 
т 02 . 
У; р - реальное выходное значение нейрона і при подаче на вхо- 


ды ИНС р - го образа; 
а; р - Эталонное выходное значение этого нейрона. 


Если ошибка существенна, то перейти на шаг 1. Иначе закон- 
ЧИТЬ. 

В целом метод обратного распространения ошибки позволяет 
достаточно эффективно проводить обучение многослойных ИНС, од- 
нако в сложных задачах его использование может быть сопряжено с 
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целым рядом особенностей, приводящих к недопустимо долгому 
времени обучения. Рассмотрим их подробнее. 

Снижение эффективности обучения. Из выражения (4.7) сле- 
дует, что, когда выходное значение у," стремится к нулю, эффек- 
тивность обучения заметно снижается. При двоичных входных век- 
торах в среднем половина весовых коэффициентов не будет коррек- 
тироваться, поэтому область возможных значений выходов нейронов 
[0,1] желательно сдвинуть в пределы [-0,5, 0,5], что достигается про- 
стыми модификациями логистических функций, например сигмоид с 


экспонентой преобразуется к виду 


ее =. 
1+ 


ах 


С помощью таких средств время сходимости алгоритма обуче- 
ния сокращается в среднем от 30 до 50%. 

Нормализация входных значений. Значения вектора, предъяв- 
ляемого на вход сети, могут сильно отличаться друг от друга (то есть 
включать как очень большие, так и очень малые). В таком случае их 
рекомендуется нормализовать в единичный вектор с помощью деле- 
ния каждой компоненты входного вектора на его длину. 


(4.10) 


Влияние диапазона начальных весов решение. Всем весам 
сети перед началом обучения следует придать начальные значения. 
При этом рекомендуется присвоить им небольшие значения, которые 


могут быть определены по формуле. 
| 1 


и! 


[ < 
где и -число нейронов в слое /. 
Выбор шага обучения. В процессе обучения сети значения ве- 


сов могут в результате коррекции стать очень большими, тогда в со- 
І 


ответствии с (4.6, 4.9) производная (Ё"(5 = 257) будет очень мала и 


115 


обучение остановится. Кроме этого, применение градиентного метода 
оптимизации в большинстве случаев позволяет найти лишь субопти- 
мальный, а не глобальный минимум целевой функции. Эти проблемы 
связаны с выбором величины скорости обучения. Доказательство 
сходимости обучения в процессе обратного распространения основа- 
но на производных, то есть приращения весов, и, следовательно, ско- 
рости обучения должны быть бесконечно малыми, однако в этом слу- 
чае обучение будет происходить неприемлемо медленно. С другой 
стороны, слишком большие коррекции весов могут привести к посто- 
янной неустойчивости процесса обучения. Поэтому в качестве у 
обычно выбирается число меньше 1, но не очень маленькое, напри- 
мер 0,1, и оно может постепенно уменьшаться в процессе обучения. 
Кроме того, для исключения случайных попаданий в локальные ми- 
нимумы иногда, после того как значения весовых коэффициентов 
стабилизируются, у кратковременно сильно увеличивают, чтобы на- 
чать градиентный спуск из новой точки. Если повторение этой про- 
цедуры несколько раз приведет алгоритм в одно и то же состояние 
ИНС, можно более или менее уверенно утверждать, что найден 
именно глобальный минимум. 

Выбор структуры ИНС. Определение оптимальной структуры 
(топологии, конфигурации) ИНС, а именно: числа слоев и нейронов в 
них, является трудной задачей и представляет собой целое направле- 
ние нейрокомпьютерной науки. Тем не менее можно выделить сле- 
дующие рекомендации по определению топологии ИНС [5, 13]. 

1. Для некоторых типовых задач (распознавания, классифика- 
ции) уже существуют оптимальные конфигурации ИНС, поэтому це- 
лесообразно попытаться использовать именно их. 

2. Необходимо соизмерять объем сети с числом обучающих 
примеров, число которых должно быть пропорционально сложности 
сети. 

3 Число нейронов в скрытых слоях однородных многослойных 
ИНС с сигмоидальными активационными функциями может быть 
рассчитана на основе экспериментальной формулы для оценки необ- 
ходимого числа синаптических весов /\,, 
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№№, №, 
М ОРМ АЕА 
1+ 108,(%,) М Е 


х 


где №, - размерность выходного сигнала; 
М, - размерность входного сигнала; 


№, - число элементов обучающего множества. 


Кроме этого, для повышения эффективности процесса обучения 
(не менее, чем в 10-100 раз при прочих равных условиях) можно ре- 
комендовать использование метода многостраничного обучения, ко- 
торый предполагает особым образом подходить к формированию 
обучающей выборки. Под страницей подразумевается серия приме- 
ров, предъявляемая сети для обучения, при этом модификации пара- 
метров сети осуществляются, исходя из всех примеров страницы. При 
использовании данного метода необходимо учитывать следующее: 

- первую страницу рекомендуется формировать из опорных 
примеров, характеризующих особенности функции, которую должна 
будет реализовывать обученная нейронная сеть; 

- в ходе обучения объем страницы и разнообразие примеров на 
ней можно увеличить (совсем необученная сеть слишком медленно 
учится на больших страницах, а после предварительного обучения 
появляются возможности для быстрого освоения все больших стра- 
ниц); 

- каждая страница должна быть достаточно разнообразной и в 
ней должны присутствовать представители разных групп примеров. 

В большинстве же случаев оптимальный вариант конфигурации 
ИНС может быть получен на основе интуитивного выбора или экспе- 
риментально. 

Число нейронов в выходном слое. Последний слой нейронов 
играет важную роль при работе ИНС, поскольку именно он отвечает 
за окончательную классификацию образов. Так, для разделения мно- 
жества входных образов по двум классам достаточно всего одного 
нейрона. При этом каждый логический уровень — «1» и «0» – будут 
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обозначать отдельный класс. На двух выходах можно закодировать 
уже 4 класса и так далее. Однако результаты работы сети, имеющей 
максимально плотную структуру, не очень надежны. Для повышения 
достоверности классификации желательно ввести избыточность пу- 
тем выделения каждому классу одного нейрона в выходном слое или, 
что еще лучше, нескольких, каждый из которых обучается определять 
принадлежность образа к классу со своей степенью достоверности, 
например высокой, средней и низкой. Такие ИНС позволяют прово- 
дить классификацию входных образов, объединенных в нечеткие 
(размытые или пересекающиеся) множества. Это свойство приближа- 
ет подобные НС к условиям реальной жизни. 

Рассмотрим возможности применения ИНС для оценки креди- 
тоспособности физического лица. В качестве факторов, определяю- 
щих кредитоспособность, будем использовать возраст, образование, 
площадь квартиры, наличие автомобиля, длительность проживания в 
данном регионе. В табл. 4.3 приведена часть накопленной статистики 
возвратов или невозвратов взятых кредитов, в некоторой финансовой 
организации. 


Таблица 4.3 
Фрагмент статистики по кредитам 
Сумма Воз- Образование | Пло- | Автомо- Срок Давать 
креди- раст щадь биль прожи- | кредит 
та, руб. квар- вания 
тиры, 
м2 
13500 37 Специальное 46 Отечеств. 28 Нет 
7500 38 Среднее 29 Импорт. 12 Да 
14500 60 Высшее 34 Нет 30 Нет 
15000 28 Специальное 14 Отечеств. 21 Да 
32000 59 Специальное 53 Отечеств. 29 Да 
11500 25 Специальное 38 Отечеств. 9 Да 
61500 29 Высшее 26 Нет 18 Нет 
25500 68 Высшее 45 Отечеств. 30 Нет 
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Данные из табл. 4.3 являются обучающим множеством, на кото- 
ром будет тренироваться ИНС. Учитывая тот факт, что поля имеют 
как числовые, так и символьные значения, требуется их нормализа- 
ция, которая в данном случае может быть проведена следующими 
способами. 

1. Линейная нормализация. Используется только для непрерыв- 
ных числовых полей. Позволяет привести числа к диапазону 
[о1п..тах], где минимальному числу из исходного диапазона будет 
соответствовать тіп, а максимальному — тах. Остальные значения 
распределятся между шш и тах. Пример такой нормализации к диа- 
пазону [0..1] приведен в табл. 4.4. 


Таблица 4.4 
Пример линейной нормализации 
Поле до нормализации Поле после нормализации 

-5 (пт) 0 

2,3 0,8111 

ты 0,6777 
4 (тах) 1 

3.3 0,9444 


Графическая интерпретация такого преобразования представле- 


на на рис. 4.9. 


= 11 2.3 4 


0 0.678 0.811 1 


Рис. 4.9. Линейная нормализация 


2. Уникальные значения. Используется для дискретных значе- 
ний. Такими являются строки, числа или даты, заданные дискретно. 
Если величины можно сравнить друг с другом, то их нормализация 
заключается в их упорядочивании по возрастанию и нумерации с по- 
следующей заменой их значений порядковым номером. 

Пример нормализации этого вида приведен в табл. 4.5. 


119 


Таблица 4.5 


Пример нормализации уникальных значений 


Поле до нормализации Поле после нормализации 
Маленький 1 
Средний д 
Большой 3 
Огромный 4 


3. Битовая маска. Используется для дискретных значений. Этот 
вид нормализации следует использовать для величин, которые можно 
только сравнивать на равенство или неравенство, но нельзя опреде- 
лить, какое больше, а какое меньше. Все значения заменяются поряд- 
ковыми номерами, а номер рассматривается в двоичном виде или в 
виде маски из нулей и единиц. Тогда каждая позиция маски рассмат- 
ривается как отдельное поле, содержащее ноль или единицу. После 
такой нормализации на вход нейросети будет подаваться не одно это 
поле, а столько полей, сколько разрядов в маске. Пример нормализа- 
ции этого вида приведен в табл. 4.6, где каждому символьному значе- 
нию поля ставится в соответствие двоичный код. 


Таблица 4.6 
Пример нормализации уникальных значений 
Поля после нормализации 
Поле до нормализации 
(битовая маска) 

Москва 00 
Воронеж 01 

Рязань 10 

Тула 11 


Таким образом, поля «Сумма кредита», «Возраст», «Площадь 
квартиры» и «Длительность проживания», имеющие непрерывные 
значения, с помощью линейной нормализации будут преобразованы к 
интервалу [-1..1]. Образование представлено тремя уникальными зна- 
чениями, которые, сравнив, можно упорядочить по возрастанию как 
среднее, специальное и высшее. Следовательно, здесь может быть 
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использован второй вид нормализации. Значения поля «Автомобиль» 
явно упорядочить нельзя, поэтому с помощью третьего типа норма- 
лизации их необходимо закодировать в виде битовой маски. Для это- 
го потребуется два бита (импортный автомобиль — 00, отечественный 
автомобиль - 01, нет автомобиля - 10). 

Дальнейшее решение этой задачи будет выполняться в системе 
интеллектуального анализа данных Оедасюг фирмы ВазеОтопр Габ$з. 

Вначале необходимо импортировать исходные данные и назна- 
чить категории полям таблицы (входное, выходное, информацион- 
ное). После чего в обучающем множестве определяется число запи- 
сей, используемых для тестирования ИНС. На следующем шаге 
должна быть выбрана конфигурация ИНС и параметры обучения. Для 
рассматриваемой задачи использовалась ИНС со структурой 7х2х1, 
где во входном слое семь нейронов, скрытом — два нейрона и в вы- 
ходном — один нейрон, значение выхода которого является решением 
о предоставлении кредита. 

После обучения нейросеть можно использовать для принятия 
решения о выдаче кредита физическому лицу. Это можно сделать, 
применяя анализ «что-если» (рис. 4.10). 


Поле Значение 
ЕР 47 Входные 


9.0 Сумма кредита 7000 
-.9.0 Возраст 37 


ар Образование специальное 


~‹9.0 Площадь квартиры 3# 
ар Автомобиль отечественная 
: :..9.0 Срок проживания 22 
8-9 Выходные 
і: аб Давать кредит Да 


Рис. 4.10. Определение с помощью ИНС решения о предоставлении кредита 


Кроме этого, может быть определена зависимость выходного 
поля от одного из входных факторов при фиксированных значениях 
остальных. Так, требуется узнать, на какую сумму кредита может 
рассчитывать человек, обладающий определенными характеристика- 
ми (рис. 4.11). 


121 


Нет +” 


Зависимость "Давать кредит" от "Сумма кредита" 


Давать кредит 


оо ооо о о ооо о со 
И-НИ - И-И-И 
И-И-И И-И-И 
оо шошо шо шо шю во 
== чач о о т т шә шә Фә Ф 


Сумма кредита 


Рис. 4.11. Зависимость результата от заданного фактора 


Из приведенной диаграммы можно сделать вывод, что человек в 
возрасте 37 лет со специальным образованием, имеющий квартиру 
площадью 37 кв. м, отечественный автомобиль и проживающий в 
данной местности 22 года может рассчитывать на сумму кредита не 
больше 20 000. 

В целом целесообразность применения ИНС для решения зада- 
чи прогнозирования не ограничивается только возможностью работы 
с произвольными типами данных, но и связана с независимостью от 
равномерности распределения точек аппроксимации, наличием гиб- 
ких средств нормализации исходных данных, а также эффективно- 
стью в задачах большой размерности. 

Как отмечалось ранее, существует две основные концепции 
обучения ИНС: с учителем и без учителя. Если в первом случае про- 
цедура обучения подразумевает предоставление сети как входные, 
так и выходные образы, то во втором случае для обучения сети доста- 
точно только входной информации. Подобные возможности ИНС от- 
крывают целый ряд областей, где они могут быть успешно примене- 


ны, особенно в задачах классификации и кластеризации информации. 
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4.4. Самоорганизующиеся нейронные сети 


Нейронные сети, использующие принципы обучения без учите- 
ля, часто относят к самоорганизующимся, а именно способным осо- 
бым образом группировать и обобщать информацию (следует отме- 
тить, что не все специалисты в области ИНС поддерживают такую 
терминологию, так как под самоорганизацией обычно подразумевают 
изменение структуры системы, а не связанной с ней информации, по- 
этому более логичным будет термин самообучающиеся нейронные 
сети). 

Процесс обучения без учителя, как и в случае обучения с учите- 
лем, заключается в подстраивании весов синапсов. При этом их 
подстройка может проводиться только на основании информации о 
состоянии нейрона и уже имеющихся значениях весовых коэффици- 
ентов. 

Среди алгоритмов, предназначенных для данного типа обучения, 
можно выделить два - предложенных Хеббом и Кохоненном [5, 13]. 
Каждый из них имеет строгую математическую теорию, а также ряд 
модификаций. Однако именно модель обучения без учителя, предло- 
женная Кохоненном в 1984 году и являющаяся классической, полу- 
чила наибольшее распространение при решении практических задач. 
Причинами этого являются более точная работа, а также близость за- 
ложенных в ней идей к реальному функционированию мозга. 

В мозге нейроны располагаются в определенном порядке так, 
что некоторые внешние физические воздействия вызывают ответную 
реакцию нейронов из определенной области мозга. Так, в той части 
мозга, которая отвечает за восприятие звуковых сигналов, нейроны 
группируются в соответствии с частотами входного сигнала, на кото- 
рых они резонируют. Хотя строение мозга в значительной степени 
предопределяется генетически, отдельные структуры мозга форми- 
руются в процессе самоорганизации. Алгоритм Кохоненна в некото- 
рой степени напоминает процессы, происходящие в мозге. 
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Алгоритм Кохоненна дает возможность строить нейронную сеть 
для разделения векторов входных сигналов на подгруппы. Сеть со- 
стоит из № нейронов, образующих прямоугольную решетку на плос- 
кости (рис. 4.12). Элементы входных сигналов подаются на входы 
всех нейронов сети. В процессе работы алгоритма настраиваются си- 
наптические веса нейронов. 

Входные сигналы - вектора действительных чисел - последова- 
тельно предъявляются сети. Желаемые выходные сигналы не опреде- 
ляются. После того, как было предъявлено достаточное число вход- 
ных векторов, синаптические веса сети определяют кластеры. 


ВЫХОДНЫЕ 
НЕИРОНЫ 


Рис. 4.12. Сеть Кохоненна 


Таким образом, с помощью обучения без учителя ИНС позво- 
ляют эффективно решать еще один класс задач — кластеризации или 
классификации информации. Несмотря на то, что в этом контексте 
эти задачи схожи по характеру, однако в других случаях они разли- 
чаются. Поэтому следует дать определения терминам класс и кластер. 

Класе — множество объектов, имеющих схожие признаки, ха- 
рактеристики или свойства. 

Кластер — множество объектов, находящихся на расстоянии 
друг от друга, не превышающем некоторое значение меры близости. 

Для отнесения объекта к кластеру необходимо найти кластер с 
минимальным расстоянием от этого объекта до центроида кластера. 
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Как правило, для этого используется расчет Евклидова расстояния 
или расстояния Хеминга. 

В результате решения задачи кластеризации получается карта 
кластеров, где близко расположенным кластерам соответствуют бо- 
лее близкие друг к другу входные вектора нейросети. Все это позво- 
ляет выполнять наглядное упорядочивание многопараметрической 
информации. Важно, что при этом могут быть обнаружены неожи- 
данные скопления «близких» данных, последующая интерпретация 
которых пользователем может привести к получению нового знания 
об исследуемом объекте. 

Рассмотрим шаги процесса обучения нейросети по алгоритму, 
предложенному Кохоненном. Отметим, что в данном случае под ней- 
росетью понимается однослойный персептрон – слой Кохоненна [13]. 

1. Инициализация сети. 

Весовым коэффициентам сети присваиваются малые случайные 
значения, которые рекомендуется определять по формуле (4.11). 

2. Сети предъявляется новый входной вектор. 

При этом рекомендуется выполнить нормализацию значений 
вектора по формуле (4.10). 

3. Вычисляется Евклидово расстояние до всех нейронов слоя 
Кохоненна 


Г) 

2 

В; = Хх; у) \ 
1=] 


где х; - компонента і входного вектора Х; 
у; ; - вес входа і нейрона /. 


Нейрон, который имеет весовой вектор, самый близкий к Х объ- 
является «победителем». Этот весовой вектор, обозначаемый УС, 
становится основным в группе весовых векторов, которые лежат в 
пределах расстояния Дот ИС. 

Следует отметить, что иногда слишком часто «побеждающие» 
нейроны принудительно исключаются из рассмотрения, чтобы «урав- 
нять права» всех нейронов слоя. Простейший способ реализовать это 
заключается в торможении (уменьшении значения синаптической 
связи) только что выигравшего нейрона. 
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4. Настраиваются «нейрон — победитель» и его соседи. 

Для всех весовых векторов в пределах расстояния 2 от Жс из- 
меняются значения синаптических связей 

№; (2+1) = м, (чу. – и (2), 

где ѓ – номер цикла обучения; 

у(1) — шаг обучения, уменьшающийся с течением времени. 

5. Повторяются шаги со 2 по 4 для каждого входного вектора. 

После обучения кластеризация выполняется посредством пода- 
чи на вход сети испытуемого вектора. Нейрон со значением, равным 
единице, является индикатором кластера. 

Для определения выходных значений слоя Кохоненна использу- 
ется правило «победитель получает все». Согласно ему для данного 
входного вектора только один нейрон слоя Кохоненна выдает едини- 
цу, все остальные — ноль. Расчет значения выхода каждого нейрона 
выполняется в соответствии с формулой (4.1). Нейрон с максималь- 
ным значением 5 объявляется «победителем», и его выход устанавли- 
вается равным единице. 

В процессе обучения ИНС значения ПО и у постепенно умень- 
шаются. В начале обучения коэффициент у рекомендуется устанав- 
ливать приблизительно равным 1 и уменьшать в процессе обучения 
до 0, в то время как О может в начале обучения равняться макси- 
мальному расстоянию между Х и весовыми векторами, а в конце обу- 
чения стать настолько маленьким, что будет обучаться только один 
нейрон. 

Обучающий алгоритм настраивает синаптические связи в окре- 
стности «победившего» нейрона таким образом, чтобы они были по- 
хожими на входной вектор. Сначала в эту окрестность могут входить 
все нейроны слоя Кохоненна, однако в процессе обучения сети такие 
зоны соседства будут сужаться, образуя топологические области 
(карты), которые соответствуют определенным входным векторам. 
Так, на рис. 4.13 показаны зоны соседства (С;) в различные моменты 
времени для нейрона /, которые уменьшаются в процессе обучения 
сети. В результате фактически возникает группировка входных век- 
торов в кластеры, каждый из которых ассоциируется с 
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определенным нейроном. Подобный принцип функционирования 
ИНС известен как самоорганизующиеся карты Кохоненна [5]. 


Рис. 4.13. Зоны топологического соседства на различных циклах обучения ИНС 


Самоорганизующиеся карты представляют собой отображение 
многомерного распределения точек на двумерную решетку с регу- 
лярным соседством меду узлами. При этом близким узлам на карте 
отвечают близкие вектора в исходном многомерном пространстве, то 
есть сохраняется не только структура разбиения точек на кластеры, 
но и отношение топологической близости между ними. Отметим, что 
карты Кохоненна дают высокую степень наглядности при изучении 
распределения экспериментальных данных. Неоднородности в «рас- 
краске» карты могут отвечать различным режимам поведения уста- 
новки или прибора, например служить указанием на нежелательные 
соотношения параметров при эксплуатации. 

Приведем некоторые из простых правил, позволяющих повы- 
сить эффективность работы описанного алгоритма. 

1. Инициализация весовых коэффициентов случайными значе- 
ниями может привести к тому, что различные классы, которым соот- 
ветствуют плотно распределенные входные вектора, сольются или, 
наоборот, раздробятся на дополнительные подклассы в случае близ- 
ких векторов одного и того же класса. Для избежания такой ситуации 
используется метод выпуклой комбинации. Суть его сводится к тому, 
что входные нормализованные вектора подвергаются преобразова- 
нию 
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х = (0): х + (1 и 
И 


2. Согласно рекомендации Кохоненна для получения хорошей 
статистической точности число обучающих циклов должно быть по 
крайней мере в 500 раз больше числа выходных нейронов. 

В общей постановке задачи кластеризации принято выделять 
два основных случая: 

- с изначально известным числом кластеров (классов); 

- с заранее неопределенным числом кластеров. 

Применение ИНС при решении задач кластеризации для перво- 
го случая было рассмотрено ранее, поэтому для полноты изложения 
кратко отметим особенности использования нейронных сетей для 
второй ситуации. 

При решении задач кластеризации с неизвестным числом кла- 
стеров критерием принадлежности конкретному классу служит за- 
данное заранее расстояние (мера сходства) между сигналами. Мерой 
сходства/различия для бинарных сигналов может служить расстояние 
Хемминга (число отличающихся битов в двух бинарных векторах). 
Для других типов сигналов - Евклидово расстояние. В свою очередь, 
процесс определения кластеров заключается в следующем. 

Путем попарного сравнения выбираются два наиболее разли- 
чающихся входных сигнала. Далее считают, что первый сигнал при- 
надлежит первому кластеру, другой - второму кластеру. Строится 
обучающая выборка традиционного вида, содержащая два примера - 
пары (вход, известный выход). По данной выборке проводится обу- 
чение сети алгоритмом обратного распространения. 

Случайным образом выбирается один из оставшихся входных 
сигналов и вводится в нейронную сеть. Если среднеквадратичное от- 
клонение текущего выходного сигнала от одного из известных вы- 
ходных сигналов обучающей выборки меньше заданного порогового 
значения, то входной сигнал считается принадлежащим кластеру 
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соответствующего примера. В противном случае считается, что вход- 
ной сигнал принадлежит новому кластеру. Строится обучающая вы- 
борка из трех примеров и по ней выполняется обучение. 

Аналогичные действия повторяются до тех пор, пока не закон- 
чатся входные сигналы. 

Затем для каждого сформированного на первом этапе кластера 
строится «центральный» или «эталонный» образ, каждый элемент ко- 
торого есть среднее арифметическое соответствующих элементов 
всех примеров данного кластера. 

Далее с помощью меры Хемминга или Евклида определяется 
расстояние между парами «центральных» образов. Если расстояние 
меньше некоторого порогового значения, то два кластера объединя- 
ются в один. Соответствующим образом формируется новая обучаю- 
щая выборка, и по ней проводится обучение нейронной сети. Эту 
операцию повторяют до тех пор, пока не останется ни одной пары 
кластеров, расстояние между «центральными» образами которых 
меньше порогового значения. 

В качестве примера применения самоорганизующихся карт рас- 
смотрим решение задачи кластеризации типа цветков ириса на основе 
их характеристик. Эта задача, известная как «ирисы Фишера», отно- 
сится к тестовым и входит в группу задач для исследования возмож- 
ностей нейросетевого моделирования (проект ЕГЕМА - Епһапсеа 
Геагпіпо ог ЕуоГийуе Меига! Агсһіќесіџгезѕ). 

Ниже представлен фрагмент таблицы исходных данных 
(табл. 4.7) для кластеризации, в качестве средства программной реа- 
лизации которой будет использоваться система Юейџсіќог. 

Характеристики цветков соответствуют названиям столбцов 
таблицы. Задача состоит в том, чтобы определить по различным па- 
раметрам цветка его класс. Предполагается, что цветы одного класса 
имеют схожие значения параметров, следовательно, они должны рас- 
полагаться в одном кластере. 
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Процесс формирования карты этих кластеров заключается в вы- 
полнении следующей последовательности действий. 

На первом шаге настраивается назначение столбцов таблицы, 
при этом входными данными считаются «Длина чашелистика», «Ши- 
рина чашелистика», «Длина лепестка», «Ширина лепестка», выход- 
ными – «Класс цветка». 


Таблица 4.7 
Фрагмент исходных данных кластеризации 

Длина Ширина Длина Ширина Класс 

чашелистика | чашелистика лепестка лепестка цветка 

50 33 14 2 Ѕеѓоѕа 
64 28 56 22 Упеписа 
65 28 46 15 УегѕісоІо 
67 31 56 24 Упеписа 
63 28 Э 15 Упеписа 

46 34 14 3 Ѕеѓоѕа 
62 22 45 15 УегѕісоІо 
59 32 48 18 УегѕісоІо 


На втором шаге необходимо настроить способ разделения ис- 
ходного множества данных на тестовое и обучающее, а также число 
примеров в том и другом множестве. 

Следующий шаг предлагает настроить параметры карты (коли- 
чество ячеек по Х и по Ү, их форму) и параметры обучения (способ 
начальной инициализации, тип функции соседства, перемешивать ли 
строки обучающего множества и количество эпох, через которые не- 
обходимо перемешивание) (рис. 4.14). 


Параметры карты Вид карты 


Размер по осихХ 


Размер по оси 


Кол-во ячеек 


Форма ячеек [Шестиугольные ый | 


Рис. 4.14. Настройка карты отображение кластеров 
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На четвертом шаге настраиваются параметры остановки обуче- 
ния (рис. 4.15). 
Считать пример распознанным, если ошибка меньше 0,05 


М По достижению эпохи 130 — 


Обучающее множество 


ГГ Средняя ошибка меньше 
ГГ Максимальная ошибка меньше 


ГГ Распознано примеров (2) 


Тестовое множество 


ГГ Средняя ошибка меньше 


ГГ Максимальная ошибка меньше 


[ГГ Распознано примеров (2) 


Рис. 4.15. Настройка условий прекращения обучения 


На пятом шаге настраиваются остальные параметры обучения 
(рис. 4.16) — способ начальной инициализации, тип функции соседст- 
ва и также параметры кластеризации — автоматическое определение 
числа кластеров с соответствующим уровнем значимости либо фик- 
сированное число кластеров. Предоставляется возможность настро- 
ить интервалы обучения. Каждый интервал задается числом эпох, ра- 
диусом обучения и скоростью обучения. Число кластеров устанавли- 
вается равным трем. 


Способ начальной инициализации карты [из собственных векторов ~ 


М Количество эпох, через которое необходимо перемешивать строки 


Радиус обучения 


[ро = 
В начале обучения Г =] 
[ол = 


Скорость обучения 


В начале обучения 


В конце обучения В конце обучения 


Функция соседства [ступенчатая ы | 


Кластеризация 


ГГ Автоматически определить количество кластеров 


Уровень значимости, & Г ~] Фиксированное кол-во кластеров Е = 


Рис. 4.16. Настройка параметров обучения 


На последнем шаге запускается сам процесс обучения 
(рис. 4.17). При этом во время обучения могут быть просмотрены 
число распознанных примеров и текущие значения ошибок. 
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Обучающее множество Тестовое множество 


Эпоха 
ЕЮ Макс. ошибка | 6,69Е-02 ||ЕМ Макс. ошибка | 185Е-01 
3 М Средн. ошибка | 2.07Е-02 ||ЕЗМ№ Средн. ошибка | 9.20Е-02 Время обучения 
Распознано (2) | 92,36 Распознано (2) | 37 50 0:00:13 


Темп обновления 


100 105 110 115 120 125 


Рис. 4.17. Визуализация процесса обучения нейросети 


Далее после настройки параметров отображения могут быть 
просмотрены результаты кластеризации данных (рис. 4.18). 


Уегсою  \ігоіпіса 


Рис. 4.18. Результаты кластеризации 
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Как следует из рис. 4.18, анализ результатов может быть выпол- 
нен не только в целом по конкретному цветку, но и по каждой из его 
характеристик. Качество кластеризации можно оценить, просмотрев 
карту «КЛАСС ЦВЕТКА». На ней видно, что большинство цветов 
были классифицированы правильно. Заметим, что все цветы класса 
ъеюоза попали в один кластер. Это говорит о значительном отличии 
параметров цветов этого класса от других. Явное различие наблюда- 
ется по длине и ширине лепестка. То, что часть примеров Уиеписа 
попала в класс Уегз1со]о и наоборот, говорит о меньшем различии 
этих классов. На картах, в отличие от зеюза, не видны резкие отличия 
параметров цветов этих двух классов. Этим как раз и объясняется 
«проникновение» некоторой части примеров в другой кластер. 

Таким образом, применение самоорганизующихся карт позво- 
лило визуально представить начальное многомерное (четырехмерное) 
пространство исходных данных в двумерной форме, удобной для вос- 
приятия и анализа. Информация, описывающая цветки, была сгруп- 
пирована в три кластера, соответствующие типам цветков «Зеюза», 
«Уег$1с010» и «Утепта». Вследствие этого в дальнейшем может быть 
достаточно точно определен тип цветка на основе его характеристик, 
отсутствующих в данных кластеризации. 


4.5. Развитие моделей нейросетей и методов 
их обучения 


Среди моделей нейронных сетей существуют такие, которые по 
способу обучения нельзя отнести к традиционным (обучающихся с 
учителем или без него). В таких сетях весовые коэффициенты синап- 
сов рассчитываются только однажды перед началом функционирова- 
ния сети на основе информации об обрабатываемых данных. Из сетей 
с подобной логикой работы наиболее известна сеть Хопфилда, кото- 
рая обычно используется для организации ассоциативной памяти. 

Отметим, что ассоциативность — важная особенность человече- 
ской памяти, то есть для порождения некоторого воспоминания чело- 
веку необходимо провести ассоциацию связанного с ним события или 
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объекта. Так, несколько музыкальных тактов могут вызвать целую 
гамму чувственных воспоминаний, включая пейзажи, звуки и запахи. 
Напротив, обычная компьютерная память является адресуемой, то 
есть информация извлекается по предъявляемому адресу. 

Структурная схема сети Хопфилда приведена на рис. 4.19. Она 
состоит из единственного слоя нейронов, число которых является од- 
новременно числом входов и выходов сети. Каждый нейрон связан 
синапсами со всеми остальными нейронами, а также имеет один 
входной синапс, через который осуществляется ввод сигнала. Выход- 
ные сигналы, как обычно, образуются на аксонах. 


обратная связь 


Ү; 


х: 


Хп 


Вход Выход 


Уп 


Рис. 4.19. Структура нейронной сети Хопфилда 


Как видно из рис. 4.19 сеть Хопфилда в отличие от ранее рас- 
смотренных моделей ИНС имеет обратные связи. В результате от- 
клик таких сетей является динамическим, то есть после предъявления 
нового входа вычисляется выход и, передаваясь по обратной связи, 
модифицирует вход. Этот процесс повторяется многократно. Все это 
является причиной возможной неустойчивости сети , когда выход 
вместо стабилизации в постоянное значение непредсказуемо изменя- 
ется. Проблема устойчивости явилась главным препятствием, не 
дающим полноценно использовать этот тип ИНС, однако в 
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последствии была получена теорема, описавшая подмножество сетей 
с обратными связями, выходы которых в конце концов достигают ус- 
ТОЙЧИВОГО СОСТОЯНИЯ. 

Задача, решаемая данной сетью в качестве ассоциативной памя- 
ти, как правило, формулируется следующим образом [5, 13]. Известен 
некоторый набор двоичных сигналов (изображений, звуковых оциф- 
ровок, прочих данных, описывающих некие объекты или характери- 
стики процессов), которые считаются образцовыми. Сеть должна 
уметь из произвольного неидеального сигнала, поданного на ее вход, 
выделить («вспомнить» по частичной информации) соответствующий 
образец (если такой есть) или «дать заключение» о том, что входные 
данные не соответствуют ни одному из образцов. В общем случае 
любой сигнал может быть описан вектором Х = іх: і = 1...п}, и – чис- 
ло нейронов в сети и размерность входных и выходных векторов. 
Каждый элемент х; равен либо +1, либо -1. Обозначим вектор, описы- 
вающий /-й образец, через А“, а его компоненты соответственно – х; 
к= 1...р, р – число образцов. Когда сеть распознает (или «вспомнит») 
какой-либо образец на основе предъявленных ей данных, ее выходы 
будут содержать именно его, то есть Ү = а ‚ где У- вектор выходных 
значений сети. В противном случае выходной вектор не совпадет ни с 
одним из образцов. 

Если, например, сигналы представляют собой некие изображе- 
ния, то, отобразив в графическом виде данные с выхода сети, можно 
будет увидеть картинку, полностью совпадающую с одной из образ- 
цовых (в случае успеха), или же «вольную импровизацию» сети (в 
случае неудачи). 

Пример постановки задачи распознавания с применением сети 
Хопфилда приведен на рис. 4.20. Здесь имеется пять образов, которые 
представляют собой изображения букв размером 5 на 6 точек (рис. 
4.20 а). Требуется определить образ на основе подаваемых на вход 
сети зашумленных изображений (рис. 4.20 6). 
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а) 


еа 


Рис. 4.20. Пример задачи распознавания: 
а – эталонные образы; 6 – зашумленные варианты эталонных образов 


Подобно другим моделям ИНС, процесс настройки сети Хоп- 
филда включает два этапа: инициализацию и обучение. 

На стадии инициализации сети весовые коэффициенты синапсов 
устанавливаются следующим образом: 


р 
Ужхр іж у 
р ў к=1 
0,1 = у. 

Здесь 1, / – индексы соответственно предсинаптического и пост- 
синаптического нейронов; х/, 5 — 1-й и /-й элементы вектора А-го 
образца. 

После задания весов сеть может быть использована для получе- 
ния запомненного выходного вектора поданному входному вектору, 
который может быть неправильным или неполным. Но перед этим 
должна быть настроена по следующему алгоритму. 

1. На входы сети подается неизвестный сигнал. Фактически его 
ввод осуществляется непосредственной установкой значений аксо- 
нов: у(0) = х;, і = 1...п. 

2. Рассчитывается новое состояние нейронов (4.12) и новые зна- 
чения аксонов (4.13) 


50+) = у иу;00). (4.12) 
р 


+= 705,0+1)), (4.13) 
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где /— активационная функция в виде скачка, представленная на 
рис. 4.21. 


Рис. 4.21. Активационная функция для сети Хопфилда 


3. Проверяется, изменились ли выходные значения аксонов за 
последнюю итерацию. Если да — переход к пункту 2, иначе (если 
выходы застабилизировались) — окончание настройки. При этом вы- 
ходной вектор представляет собой образец, наилучшим образом со- 
четающийся с входными данными. 

Важным вопросом, связанным с нейросетью Хопфилда, являет- 
ся количество запоминаемой информации. Несмотря на то, что ИНС с 
бинарным выходным слоем может иметь 2" состояний для сети Хоп- 
филда, число запоминаемых образов (емкость ИНС) ограничивается 
значением 0,15*п. Поэтому, если при решении задачи нет потребно- 
сти в получении конкретного образа, а достаточно определить его 
номер, для реализации ассоциативной памяти эффективно может 
быть использована модификация сети Хопфилда, предложенная 
Хеммингом. 

Совершенствование возможностей нейросетей связано не толь- 
ко с разработкой их новых моделей, но и с поиском и исследованием 
других методов обучения. Рассмотренные ранее методы обучения 
принято относить к детерминированным, когда коррекция весов вы- 
полняется на основе известных их текущих значений, а также вели- 
чин входов и разницы между фактическими и желаемыми значения- 
ми выходов сети. Однако при обучении ИНС величины синаптиче- 
ских связей могут корректироваться и псевдослучайно, сохраняя те 
изменения, которые ведут к улучшению функционирования сети. 
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Методы, в которых заложен такой механизм обучения, известны как 
стохастические. Часто подобные методы используют идею так назы- 
ваемого Больцмановского обучения, в основе которого лежит имита- 
ция физической аналогии отжига металла. 

В металле, нагретом до температуры, превышающей его точку 
плавления, атомы находятся в сильном беспорядочном движении. 
Как и во всех физических системах, атомы стремятся к состоянию 
минимума энергии (единому кристаллу в данном случае), но при вы- 
соких температурах энергия атомных движений препятствует этому. 
В процессе постепенного охлаждения металла возникают все более 
низкоэнергетические состояния, пока в конце концов не будет дос- 
тигнуто самое низкое из возможных состояний, соответствующее 
глобальному минимуму энергии. В процессе отжига распределение 


энергетических уровней описывается следующим соотношением: 
с 


Ро =е Г. (4.14) 


где Р(с) – вероятность того, что система находится в состоянии с 
энергией с; К — постоянная Больцмана; Т — температура по шкале 
Кельвина. 

При высоких температурах Р(с) приближается к единице для 
всех энергетических состояний. Таким образом, высокоэнергетиче- 
ское состояние почти столь же вероятно, как и низкоэнергетическое. 
По мере уменьшения температуры вероятность высокоэнергетиче- 
ских состояний уменьшается по сравнению с низкоэнергетическими. 
При приближении температуры к нулю становится весьма маловеро- 
ятным, чтобы система находилась в высокоэнергетическом состоя- 
НИИ. 

В свою очередь, алгоритм Больцмановского обучения ИНС за- 
ключается в следующем. 

1. Определяется переменная 7, представляющая искусственную 
температуру, ей присваивается большое начальное значение. 

2. Сети предъявляются множество входов, на основе которых 
вычисляются выходы и целевая функция. Последняя представляет 
собой среднюю квадратичную ошибку между полученным и 
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желаемым выходным вектором из обучающего множества, перемен- 
ными здесь являются веса сети. 

3. Текущее значение веса случайно изменяется, а выходы сети и 
целевая функция пересчитываются. 

4. Если целевая функция уменьшилась (улучшилась), то измене- 
ние веса сохраняется. Если же изменение веса приводит к увеличе- 
нию целевой функции, то вероятность сохранения этого изменения 
вычисляется с помощью распределения Больцмана (4.14). Выбирает- 
ся случайное число г из равномерного распределения от нуля до еди- 
ницы. Если Р(с) больше, чем 7, то изменение сохраняется, в против- 
ном случае величина веса возвращается к предыдущему значению. 

Это позволяет системе делать случайный шаг в направлении 
выхода из локальных минимумов. 

Для завершения больцмановского обучения повторяют шаги 3, 4 
для каждого из весов сети, постепенно уменьшая температуру Т, пока 
не будет достигнуто допустимо низкое значение целевой функции. В 
этот момент предъявляется другой входной вектор и процесс обуче- 
ния повторяется. Сеть обучается на всех векторах обучающего мно- 
жества, с возможным повторением, пока целевая функция не станет 
допустимой для всех них. 

Однако экспериментальное исследование возможностей Больц- 
мановского обучения показало, что этот процесс имеет большую 
временную трудоемкость. Поэтому для определения случайного из- 
менения синаптических весов могут быть использованы другие спо- 
собы, например обучение Коши, метод монте-Карло, а также комби- 
нированные алгоритмы, сочетающие детерминированное и стохасти- 
ческое обучение. 

В настоящее время искусственные нейронные сети как направ- 
ление искусственного интеллекта не ограничивается рассмотренными 
типами ИНС, а развивается в направлении усложнения конфигураций 
нейросетей, решаемых ими задач, а также совершенствования мето- 
дов обучения. Так, большой интерес у исследователей вызывает изу- 
чение свойств, которые появляются при объединении различных ти- 
пов ИНС в единые нейросетевые ансамбли. Примером здесь может 
служить нейросеть встречного распространения, включающая слои 
Гроссберга и Кохоненна и позволяющая выполнять сжатие 
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информации. Кроме этого, особое место занимают исследования, на- 
правленные на моделирование нейрофизиологической деятельности 
человека (двунаправленная ассоциативная память, когнитрон), вирту- 
альной реальности (оптические нейронные сети) в сочетании с новы- 
ми подходами к обучению, такими как генетические алгоритмы. 


Контрольные вопросы 


1. Что общего и каковы отличия в функционировании нейро- 
компьютера и компьютера с архитектурой фон Неймана? 

2. При решении каких задач применение ИНС наиболее эффек- 
тивно? 

3. Какова модель искусственного нейрона и какие существуют 
основные активационные функции? 

4. Что такое персептрон? 

5. Каковы особенности алгоритмов обучения нейронной сети? 

6. В чем заключаются принципы работы алгоритма обучения без 
учителя? 

7. Какие функции не могут быть реализованы ИНС? 

8. Каковы особенности функционирования многослойной ИНС? 

9. В чем состоит алгоритм обучения многослойной ИНС? 

10. Какие существуют проблемы и способы их преодоления при 
обучении многослойной ИНС? 

11. Что такое самоорганизующиеся ИНС? 

12. В чем состоит алгоритм обучения без учителя, предложен- 
ный Кохоненном? 

13. Каковы особенности и принципы функционирования ИНС 
Хопфилда? 

14. Что такое стохастические методы обучения? 
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5. МЕТОДЫ ЭВОЛЮЦИОННОГО 
МОДЕЛИРОВАНИЯ 


Эволюционное моделирование (ЭМ) представляет собой на- 
правление в искусственном интеллекте, предназначенное для воспро- 
изведения естественных эволюционных процессов с помощью ком- 
пьютерных программ. При этом основу эволюционного моделирова- 
ния образуют такие основополагающие принципы развития живой 
природы, как наследование и улучшение в поколениях полезных 
свойств, изменчивость, а также естественный отбор. 

Алгоритмическую основу ЭМ составляют эволюционные алго- 
ритмы (ЭА), включающие генетические алгоритмы, генетическое 
программирование, эволюционные стратегии и эволюционное про- 
граммирование [2]. 


5.1. Генетические алгоритмы 


Генетический алгоритм (ГА) является наиболее известным сре- 
ди других эволюционных алгоритмов. Концепции ГА были разрабо- 
таны Дж. Холандом и теоретически обоснованы в его работе «Адап- 
тация в природных и искусственных системах». 

С практической точки зрения генетические алгоритмы пред- 
ставляют собой группу методов адаптивного поиска и многопарамет- 
рической оптимизации, копирующие механизмы естественной биоло- 
гической эволюции и основанные на использовании в процессе поис- 
ка сразу нескольких, закодированных соответствующим образом то- 
чек, которые образуют развивающуюся по заданным случайным за- 
конам популяцию. 

Как известно, вся информация о признаках и свойствах биоло- 
гической особи и человека в частности (цвет глаз, наследственные 
болезни, тип волос и т.д.) кодируется в виде особого генетического 
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кода внутри хромосомы. Аналогично и в ГА вся информация о ре- 
шаемой задаче хранится закодированной и представляется в виде 
хромосомы. 

Для уточнения ряда биологических понятий применительно к 
генетическому алгоритму приведем их определения. 

Хромосома (особь, индивид, строка, решение) — структура дан- 
ных, содержащая закодированные в виде генов параметры задачи и 
описывающая ее решение в виде точки пространства поиска. 

Ген (признак) — элемент, из которых состоит хромосома, как 
правило, соответствует закодированному значению одного параметра 
задачи. 

Аллель — элементарный участок хромосомы, образующий ген. 

Математически ГА можно рассматривать как метод стохастиче- 
ской оптимизации для задач дискретной оптимизации вида [9]: 
минимизировать /(х) при условии, что хе О = {0,}", 

где /:0 >> К представляет целевую функцию (ЦФ); 

х: 2 > К - п – мерный двоичный вектор из дискретного множе- 
ства О, называемый хромосомой длины и; 

множество О = {0,}" представляет собой множество вершин и — 
мерного гиперкуба с ребром равным 1; 

К = (-00; +оо) - множество действительных чисел. 

С позиций ЭА целевая функция, моделирующая собой условия 
для адаптации биологических особей во внешней среде, называется 
бќпеѕѕ-функцией. Считается, что чем выше значение ћїёпеѕѕ-функции 
имеет хромосома, тем лучше решение, которое она представляет, 
удовлетворяет цели. 

Генетические алгоритмы в процессе своей работы используют 
два разделенных пространства: пространство поиска и пространство 
решений. 

Пространство поиска представляет собой область двоичных на- 
боров закодированных решений задачи, область решений — множест- 
во конкретных решений. 

На рис. 5.1 представлено отображение параметров задачи в их 
хромосомное представление в ГА. 
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Рис. 5.1. Бинарное кодирование параметров задачи в ГА 


Для повышения эффективности работы ГА, кроме обычной 
двоичной кодировки, для кодового представления параметров мо- 
жет использоваться код Грея (первые 16 слов этого кода для и = 4 
приведены в табл. 5.1). 


Таблица 5.1 
Сравнение двоичного кода и кода Грея 
Целое Двоичный код Код Грея 
0 0000 0000 
1 0001 0001 
2 0010 0011 
3 0011 0010 
4 0100 0110 
5 0101 0111 
6 0110 0101 
Я, 0111 0100 
8 1000 1100 
9 1001 1101 
10 1010 1111 
11 1011 1110 
12 1100 1010 
13 1101 1011 
14 1110 1001 
15 1111 1000 


Отличительной характеристикой кода Грея является его 
высокая помехозащищенность, благодаря непрерывности бинарной 


143 


комбинации, изменение кодируемого числа на единицу соответству- 
ет изменению кодовой комбинации только в одном разряде. 

На рис. 5.2 приведен пример кодирования параметров задачи 
для случая, когда требуется оптимизировать функцию трех перемен- 
ных [= (х,х›,х3). Каждый из трех параметров х!,х›,х. кодируется 
в виде пятибитового гена х! , а вектор Х = (х,х›,хз) соответственно 
в виде составной хромосомы х общей длиной 15 битов. 


Рис. 5.2. Кодирование вектора параметров 


Также наряду с бинарным кодированием решений в ГА может 
быть использовано вещественное, а также целочисленное десятичное 
представление хромосом, что бывает эффективно при решении ком- 
бинаторных задач оптимизации. 

Процесс работы ГА состоит в постепенном изменении (эволю- 
ции) объектов популяции в соответствии с принципом, что каждая 
новая популяция есть комбинация из лучших элементов предыдущей, 
а также новых решений, необходимых для продолжения поиска. В ре- 
зультате эффективно используется информация, накопленная в про- 
цессе эволюционного моделирования. 

Для вычисления последующих популяций к предыдущим при- 
меняются специальные генетические операторы: отбор или селекция 
(ѕеіеспоп), кроссинговер или скрещивание (сгоѕѕіпооуег) и мутация 
(тиќайоп) [1, 2, 9]. 

Оператор отбора. Используется для определения на основе 
значений ћіпеѕѕ-функции хромосом-кандидатов в следующее поколе- 
ние. Для реализации этого в ГА применяются различные схемы се- 
лекции, наиболее простая из которых — пропорциональный отбор, 
при котором число копий хромосомы в следующем поколении опре- 


деляется как № ҒО), 

где № – общее число хромосом; 

Г(х;) - относительная оптимальность хромосомы х; в популя- 
ЦИИ. 
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Ход =- 60 — (5.1) 
У (х). 
1 

Следствием такой схемы отбора является то, что в следующее 
поколение не попадут хромосомы с низкой оптимальностью (табл. 
5.2, хромосома хз), что неоправданно, так как они могут быть полез- 
ны при выполнении последующих генетических операторов. В связи 
с этим вместо пропорционального отбора обычно используется его 
стохастическая модификация, известная как метод «колесо рулетки», 
при котором хромосомы — кандидаты из С(/) - го поколения - выби- 
раются для выживания в следующем С(#+/) — м поколении путем ис- 
пользования колеса рулетки. Каждая хромосома х;(!) в популяции 
представлена на колесе в виде сектора, ширина которого пропорцио- 
нальна соответствующему значению Нпез5-функции. Таким образом, 
те хромосомы, которые имеют большую оптимальность, соответст- 
вуют большему сектору на колесе, а хромосомы с меньшей опти- 
мальностью — наименьшему сектору колеса рулетки. Процедура от- 
бора сводится к вращению колеса рулетки М раз и принятием в каче- 
стве кандидатов в следующем поколении тех хромосом 2,2х,2х3,..., Ху, 
которые будут выделены по завершении вращения. 

В результате добавления доли случайности при вращении ру- 
летки все хромосомы получают шанс иметь свои копии в следующем 
поколении. 

В качестве примера функционирования процедуры пропорцио- 
нального отбора рассмотрим оператор селекции применительно к 
популяции из пяти хромосом РЁ; = {ху,х›,...,х5} с числом бит в кодиро- 
вании и=5. 

В качестве начальной популяции хромосом принимается С(0) = 
#(10110), (11000), (11110), (01001), (00110). Для каждой хромосомы 
х; в популяции ее оптимальность оценивается с помощью Х(х;). Со- 


ответствующая доля на колесе рулетки /(х;), выделенная для і- й 
хромосомы х;, рассчитывается в соответствии с (5.1). Список членов 


начальной популяции с соответствующими им значениями Я тез$- 
функции, а также число копий хромосомы х; в следующем поколении 
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при использовании пропорционального отбора в табл. 5.2. Колесо ру- 
летки для данного примера показано на рис. 5.3 (цифры на колесе 
указывают номера хромосом). 


Таблица 5.2 
Значения функции пригодности для членов начальной популяции 
Хромосома | Оптимальность и р НЫ 
С(0) оптимальность ри пропор 
м ЛО) (х) циональном 
отборе 

Хү 10110 2,23 0,14 1 
№ 11000 УР 0,47 2 
Хз 11110 1,05 0,07 0 
Хд 01001 3,35 0,21 1 
х5 00110 1,69 0,11 1 


Таким образом, чтобы вычислить следующую популяцию 
хромосом, колесо рулетки крутят пять раз. 


Рис. 5.3. Колесо рулетки при выполнении оператора отбора 


Кроме этого, существуют и другие схемы селекции, наиболее 
известны из которых турнирный отбор, линейное ранжирование, рав- 
номерное ранжирование. 

Перечисленные схемы отбора обладают одним общим недостат- 
ком - наилучшая хромосома в популяции может быть потеряна в лю- 
бом поколении и нет гарантии, что результаты эволюции, достигну- 
тые в ряде поколений, не будут утрачены. 

Одним из способов преодоления данной проблемы является ис- 
пользование элитного отбора, который гарантирует сохранение луч- 
шей хромосомы популяции в следующем поколении. Данный вид 
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отбора гарантирует асимптотическую сходимость решения к гло- 
бальному оптимуму, но скорость сходимости при этом может суще- 
ственно различаться в зависимости от вида конкретной решаемой за- 
дачи. 

Как отмечалось ранее, выбранные таким образом хромосомы 
являются только кандидатами для следующей популяции, в которую 
попадают либо их копии, либо модификации, вследствие применения 
операторов кроссинговера и мутации. 

Оператор кроссинговера. Применяется с некоторой предвари- 
тельно заданной вероятностью Р. к случайно выбранной паре хро- 
мосом из Сү), прошедших отбор. При этом для этой пары определя- 
ется случайное число КЕ {1,2,...,п – 1}, называемое местом (сайтом) 
кроссинговера, и затем биты из двух выбранных хромосом меняются 
местами после К — го бита с вероятностью Р.. Этот процесс повторя- 
ется для остальных хромосом до тех пор, пока популяция С((#+1) не 
окажется заполненной. На рис.5.4 графически представлены действия 
оператора кроссинговера для двух 5 — ти битовых хромосом. 


Точка кроссинговера 


то [1 [о] — (110110) — |1[о{тојт 


Кав 
о 110 [о 1 в 01 [о јо {1 — ооо 
К= 3 Потомки 


Родители 
а) б) в) 


Рис. 5.4. Графическая интерпретация оператора кроссинговера 


Как видно из рис. 5.4, две родительские хромосомы (а) вступают 
в кроссинговер для выбранного сайта А=3 (б) так, что хромосомы по- 
томков (в) отличаются от родительских хромосом значениями 4 - го 
и 5 – го битов. 

Развитием одноточечного кроссинговера для бинарного кодиро- 
вания являются многоточечный, на основе метода «золотого сече- 
ния», чисел Фибоначчи, дихотомии и др., отличающиеся друг от дру- 
га эффективностью синтеза «хороших» решений. Соответственно 
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существуют версии оператора кроссинговера, предназначенные и для 
вещественного представления хромосом (арифметический, геометри- 
ческий, смешанный, нечеткий и др.) 

Различные типы кроссинговера обладают общим положитель- 
ным свойством — контроль баланса между дальнейшим использова- 
нием уже найденных хороших подобластей пространства поиска и 
исследованием новых областей. Это достигается путем сохранения 
общих блоков внутри хромосом - родителей и одновременного ис- 
следования новый областей в результате обмена фрагментами 
хромосом. 

Совместное использование операторов отбора и кроссинговера 
приводит к тому, что области пространства, обладающие лучшей в 
среднем оптимальностью, содержат больше членов популяции, чем 
другие. Как следствие эволюция популяции направляется к областям, 
содержащим оптимум с большей вероятностью, чем другие. 

Оператор мутации. После кроссинговера к хромосомам поко- 
ления С(1+1)- кандидатам применяется мутация, которая в общем 
случае может рассматриваться как процесс перехода между различ- 
ными состояниями пространства поиска. Оператор мутации состоит в 
случайном изменении (на противоположное) значения каждого бита с 
вероятностью Р, , т.е. для каждого бита (гена) хромосомы его значе- 
ние меняется с 0 на | илис 1 на 0 с вероятностью Р,. 

Допустим в качестве примера, что Р, = 0,1 и хромосома х = 


(11100) должна подвергнуться мутации. Для определения битов в ге- 
не, которые необходимо изменить выбирается независимое случайное 


— 


число Р; для каждого бита хромосомы. Если окажется, что ] — й бит 


следует изменить, иначе значение / – го бита сохраняется. Пусть для 
рассматриваемого вектора х были получены следующие случайные 
числа: А = 0,91, Р =0,43, В, =0,03, Р, =0,67, Р; = 0,29. Тогда резуль- 


татом мутации является изменение 3 — го бита хромосомы (рис.5.5). 
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Точка мутации 


До мутации 


После мутации 


Рис. 5.5. Графическая интерпретация оператора мутации 


Разновидностью мутации является инверсия, при которой уча- 
сток хромосомы покидает свое место в цепи хромосомы и, развер- 
нувшись на 180 градусов, вновь занимает прежнее положение 
(рис.5.6). 


Точка инверсии 


До инверсии 


После инверсии 


Рис. 5.6. Инверсия хромосомы 


Эффективность ГА во многом зависит не только от внутрен- 
ней структуры и модификаций его базовых операторов, но и от 
значений вероятностей их применения (Р.,Р,). Обычно в основе 
определения значений для операторов ГА лежат результаты иссле- 
дований их применения в различных сочетаниях к ряду тестовых 
оптимизационных задач. При этом влияние операторов на качество 
результата работы ГА определяется как независимо друг от друга 
(Рт = 0, Рс = 0,1..1,0 и наоборот), так и совместно. Представленные 
на рис. 5./ усредненные показатели для всех этапов тестирования 
иллюстрируют доминирование компромиссного варианта на основе 
комбинации направленного и случайного поиска. 


Средняя эффективность 


Рис. 5.7. Средние значения коэффициента эффективности ГА при 
варьировании вероятностями операторов 


Также, исходя из эмпирических соображений было установлено, 
что наиболее приемлемыми значениями вероятности кроссинговера 
являются: 0,6 < Р. < 0,99. Мутация инициирует разнообразие в попу- 
ляции, позволяя просматривать больше точек в пространстве поиска 
и преодолевать таким образом локальные оптимумы в ходе поиска. 
Однако слишком частое применение мутации приводит к разруше- 
нию хромосом с высокой приспособленностью, что влияет на сходи- 
мость решения. Именно поэтому применение мутации обычно осу- 
ществляется с малой вероятностью, порядка 0,01< Р, < 0,1. Относи- 
тельно оператора инверсии считается, что вероятность его примене- 
ния должна быть очень низкой, как правило она составляет 
Р, = 0,001. 

В общем случае выбор значений для соотношений операторов 
ГА зависит от многих факторов: тип задачи, размер популяции, осо- 
бенности генетических операторов и т.д., поэтому в большинстве ра- 
бот при отсутствии предопределенных значений лучшая их комбина- 
ция определяется на основе имитационного моделирования (прогонов 
ГА) с различными вариациями и последующим анализом результа- 
тов. 
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Математическое обоснование работы ГА как метода адаптив- 
ного поиска связано с понятием шаблона или схемы, введенного 
Дж. Холландом. Результаты исследований и анализа функциониро- 
вания ГА были сформулированы им в виде «фундаментальной тео- 
ремы о шаблонах» [2]. 

В соответствии с приведенным описанием ГА процесс его 
функционирования графически можно представить с помощью 
схемы, приведенной на рис. 5.8. 


Генотип Фенотип 


Инициализация 
Кодирование 

Вычисление функции === 
функц Решение 

пригодности НН 9 
Декодирование 

Отбор 
Определение лучшего 
решения 
Кроссинговер 


мя 


Достигнут критерий 
окончания? 


Стратегия элитизма 


Да 
Лучшее решение 


Рис. 5.8 Схема функционирования генетического алгоритма 


Приведенная схема ГА описывает этапы его выполнения сле- 
дующим образом: 
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- в соответствии с определенными ограничениями инициализи- 
руется исходная популяция потенциальных решений; 

- каждая хромосома в популяции декодируется в необходимую 
форму фенотипа для последующей оценки, вычисляется значение це- 
левой функции каждого решения с последующей трансформацией в 
значение Нте5$-функции каждой хромосомы генотипа; 

- к членам популяции применяется оператор отбора, на основе 
которого создается новая популяция, причем с большей вероятно- 
стью воспроизводятся наиболее эффективные элементы; 

- применяется оператор кроссинговера с заданной вероятностью 
для получения потомков; 

- с определенной вероятностью выполняется оператор мутации к 
каждой из полученных на предыдущем шаге хромосом; 

- при необходимости применяется стратегия элитизма — в новую 
популяцию добавляется лучшая хромосома предыдущего поколения; 

- процесс останавливается, если удовлетворены условия остано- 
ва эволюции, в противном случае повторяются этапы оценки и вос- 
произведения новой популяции. 

Критерий остановки эволюции может быть определен произ- 
вольным образом (например, получение удовлетворительного реше- 
ния, достижение определенного числа поколений, количество затра- 
ченного времени, низкая скорость сходимости и т.п.). 


Рассмотрим применение генетического алгоритма для оптими- 
зации функции вида / = У, =х чп(х, |), где -500 <= Хї <= 500, и = 10. 
і=1 


Эта функция (рис. 5.9) является достаточно сложной для поиска экс- 
тремума с помощью традиционных методов оптимизации, так как 
имеет более 10 миллионов локальных оптимумов и один глобальный 


минимум со значением - 4189.83 в точке А7 = 420,967. 
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Рис. 5.9. График оптимизируемой функции (п = 2) 


Процесс решения этой задачи будет заключаться в последова- 
тельном запуске ГА с различными значениями вероятностей приме- 
нения генетических операторов. При наличии априорной информа- 
ции о координатах оптимального решения может быть оценено каче- 
ство работы ГА. Для каждого случая ГА запускался по пять раз. В ка- 
честве результата принималось минимальное значение функции, ко- 
торое преобладало в большинстве случаев (табл. 5.3). Размер популя- 
ции устанавливался равным 100, число поколений – равным 300. 


Таблица 5.3 
Результаты эксперимента 
Вероят- Вероят- 
ность крос- ность 1 2 3 4 5 
синговера | мутации 
0,9 0,1 -4185,76 | -4189,35 | -4188,81 | -4189,83 | -4177,84 
0,8 0,2 -4189,83 | -4189,27 | -4189,83 | -4189,83 | -4189,83 
0,7 0,3 -4189,02 | -4189,39 | -4136,50 | -4185,14 | -4188,67 


Как следует из результатов эксперимента, минимальное значе- 
ние целевой функции, найденное ГА, совпадает с глобальным опти- 
мумом. На рис. 5.10 показана динамика исследования пространства 
решений на протяжении заданного числа поколений. 
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Глобальный Х2 А 
Х2 А оптимум Р . - 500 
. т 500 у А А . я 
А А Ејер ы 
Е < - 500 р 500 Х1 
-500 , * . 500 Х1 А 
{= 70 
1= 0 
Х2 А Х2 А 
-– 500 ё -– 500 
е ЫРҸ .. е о ө Ф 


500 Х1 - 500 • 500 Х1 


{= 180 {= 300 


Рис. 5.10. Динамика исследования ГА пространства решений 


В начальный момент времени ({ = 0) популяция заполнена слу- 
чайными решениями, распределенными почти по всему полю поиска. 
Далее под действием законом эволюционного моделирования проис- 
ходит постепенное перемещение популяции в области с наилучшими 
(наименьшими) значениями целевой функции. При этом случайные 
изменения решений в популяции, вызываемые оператором мутации 
приводят к перемещению между областями пространства решений, а 
применение кроссинговера — к обследованию этих областей. К поко- 
лению { = 180 в популяции теряется разнообразие и начинает прояв- 
ляться эффект насыщения, то есть среди хромосом можно выделить 
группу, которая из-за высокой по сравнению с другими решениями 
оптимальностью, тиражирует свои копии в следующие поколения. 
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На последних поколениях популяция полностью вырождается в «об- 
лачко» и в основном представляет собой копии самой лучшей на про- 
тяжении всей эволюции хромосомы, которая и определяет оптималь- 
ное решения задачи. 

Эффективность применения ГА при оптимизации в многомер- 
ных пространствах объясняется прежде всего параллельным характе- 
ром его работы, когда на каждом шаге синтезируется целая популя- 
ция возможных решений, причем на основе накопленной информа- 
ции предыдущих поколений об оптимизируемой функции. Следстви- 
ем этого является широкое исследование пространства решений и как 
результат - высокая вероятность нахождения глобального оптимума. 

Дальнейшее совершенствование генетических алгоритмов свя- 
зано с проведением исследований, направленных на развитие теории 
Холланда с целью создания новых генетических операторов, разра- 
боткой различных модификации ГА. 


5.2. Генетическое программирование 


Развитием генетического алгоритма для решения оптимизаци- 
онных задач в пространстве компьютерных программ является гене- 
тическое программирование (ГП). В данном случае в качестве объек- 
тов, составляющих популяцию, выступают не двоичные хромосомы, 
а компьютерные программы, которые, будучи исполненными, пред- 
ставляют собой кандидатов на решение поставленной задачи. 

Концепция ГП была предложена Дж. Коза в попытке создания 
средств автоматического программирования на основе эволюцион- 
ных технологий. Предпосылкой этому послужила одна из главных 
проблем ИИ – обучение компьютера решению задачи без непосред- 
ственного программирования. 

Особенностью ГП является то, что в нем не требуется кодиро- 
вать параметры решения и все манипуляции с ними выполняются на 
уровне фенотипа. Для формирования начальной популяции, пред- 
ставляющей собой совокупность случайно сформированных 
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программ, используются заранее определенные множества функций и 
терминальных символов из предметной области задачи. 

Множество функций может включать как арифметические (+, -, 
* и т.д.), логические операции (АХО, ОК, МОТ), элементарные мате- 
матические функции (511, соѕ, ехр, 102 и т.д.), так и условные, а также 
циклические операторы программирования. 

Множество терминальных символов обычно включает перемен- 
ные, а также числовые или логические константы. 

Для примера, предположим, что необходимо реализовать функ- 
цию вида Ғ=(Х АМ” 7) ОК (МОТ Х АМ” МОТ У), тогда указанное 
множество операций можно определить в виде {АМО, ОК, МОТ}, а 
множество терминальных символов - как {Х, У}. На рис. 5.11 приве- 
дено графическое изображение данного выражения в виде дерева — 
иерархического представления ГП. Здесь внутренние вершины имеют 
смысл названных функций, а внешние (оконечные) вершины пред- 
ставляют собой терминальные символы [9]. 


Рис. 5.11. Представление компьютерной программы в ГП 


Таким образом, пространство решений в ГП можно рассматри- 
вать как множество деревьев с упорядоченными ветвями, внутренние 
вершины которых соответствуют функциям , а внешние - терминаль- 
ным символам. Потребность в использовании подобного иерархиче- 
ского представления была связана с особенностями применения крос- 
синговера к хромосомам переменной длины, представление инфор- 
мации в которых подобно синтаксису языка ПІР. 
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Для оценки качества работы сгенерированных в ходе 
эволюции популяции программ используется ћіпеѕѕ-функция, обычно 
представляющая собой среднеквадратичную ошибку результата? воз- 
вращаемого синтезированной программой, и эталонного значения. 

Для формирования новой популяции в ГП используются сле- 
дующие операции: отбор, кроссинговер и мутация (факультативно). 

В результате отбора определяются кандидаты в следующее по- 
коление, обладающие лучшими значениями Ятез$-функции. 

Реализация кроссинговера начинается со случайного выбора по 
одному из узлов у каждого родителя, которые представляют собой их 
точки кроссинговера. Первый из потоков образуется посредством 
удаления фрагмента дерева первого родителя ниже его точки крос- 
синговера и включения в это место фрагмента дерева, также распо- 
ложенного ниже сайта кроссинговера второго родителя. 

Предположим, что для выполнения операции кроссинговера вы- 
браны две родительские программы, эквивалентные следующим ло- 
гическим выражениям: 

ЕІ = (МОТ Х) ОК (ХАЮ У); 
Е2 = (ХОК (МОТ 7)) ОК ((МОТХ) АМР” (МОТ У). 

Будем считать, что в качестве точки кроссинговера выбрана 
вторая вершина первого дерева (операция МОТ), а второго родителя 
соответственно — шестая вершина (операция АМО). Иерархическое 
представление выражений РІ, Е2, а также их фрагменты участвую- 


щие в кроссинговере приведены на рис. 5.12. 
Е! Р2 


9 О) 
59) © б @ 


1 сос оөб в 
оо © 


Рис. 5.12. Фрагменты программ, участвующие в кроссинговере 
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В результате две программы-потомка, полученные после крос- 
синговера, будут иметь вид, показанный на рис. 5.13, им будут 
соответствовать следующие логические выражения: 

ЕІ = ((МОТ Х) АМ” (МОТ 7)) ОК (ХАМР 7); 
Е2 = (ХОК (МОТ 7)) ОК (МОТ А). 
Р1 Е2 


Рис. 5.13. Программы, полученные в результате кроссинговера 


При этом выражение А] соответствует исходной эталонной про- 
грамме. 

В ряде случаев в ГП также может применяться модифицирован- 
ный оператор мутации. В ходе своего выполнения он выбирает слу- 
чайный узел дерева программы и удаляет все ветви, расположенные 
ниже него, заменяя при этом их случайно сгенерированным поддере- 
вом. Однако по причине схожести выполняемых функций операторов 
кроссинговера и мутации применение последнего часто является не- 
обязательным. 

В общем случае процедура ГП состоит в реализации следующих 
этапов. 

1. Генерируется начальная популяция программ, составленных 
случайным образом из некоторого числа функций и терминальных 
символов, принадлежащих соответствующим множествам. 

2. Реализуется определенная последовательность действий до 
тех пор, пока не будет выполнен критерий останова ГП: 

- выполняется тестирование сгенерированных программ, после 
чего им присваивается соответствующее значение біпеѕѕ-функции; 
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- создается новая популяция путем использования генетических 
операций, которые применяются к выбранным на основе их качества 
работы членам популяции. 

3. Наилучшая программа, появившаяся в последнем поколении к 
моменту выполнения критерия останова, принимается в качестве ре- 
зультата ГП. 

Критерием останова может выступать достижение заданного 
числа поколений или выполнение некоторого специального условия, 
определяемого спецификой решаемой задачи. 

Примером применения технологии генетического программиро- 
вания может служить решение задачи определения аналитического 
представления кривой, заданной в двумерной системе координат 
(рис. 5.14 (1 = 0)). 


+1 +1 


= 0 {= 20 


ы 1 
= 50 {= 70 
Рис. 5.14. Изменение графика аналитического выражения в 
процессе генетического программирования 


На рис. 5.14 показана последовательность поиска такого 
выражения, причем в качестве функций использовались только 
арифметические операции ++, -, *, \}. Размер популяции, вероятности 
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применения генетических операторов кроссинговера и мутации были 
равны 100, 0,8, и 0,2 соответственно. Максимальная глубина древо- 
видного представления выражений задавалась равной шести. Качест- 
во генерируемых выражений определялось как мера близости их зна- 
чений и фактических значений в точках кривой. При этом от поколе- 
ния к поколению наблюдалась тенденция постоянного уменьшения 
их различия. 

Процесс генетического программирования продолжался на про- 
тяжении # = 70 поколений, в течение которых графики генерируемых 
выражений и, следовательно, само выражение постепенно эволюцио- 
нировали от совершенно не похожих на заданную кривую до относи- 
тельно близких к ней. 

На последнем поколении была получена формула вида 
(*(1(* 4 х)) СС (хх 0.4375) (* (*(*ххх2))1))) или 
(1-4% х) *(0.4375* х? –2*х° +1), достаточно точно описывающая за- 
данную кривую. Более того, при расширении выбранного функцио- 
нального множества дополнительными функциями, например триго- 
нометрическими, могут быть синтезированы, наряду с полученной, и 
другие формы аналитических выражений этой кривой. 

Дальнейшее совершенствование генетического программирова- 
ния связано с разработкой способов уменьшения структурной избы- 
точности генерируемых программ, а также необоснованным разру- 
шением генетическими операциями их синтаксически правильных 
фрагментов. 


5.3. Эволюционные стратегии 


Эволюционные стратегии (ЭС) были разработаны в 1960-х годах 
для структурного синтеза технических систем. При этом первона- 
чально подобные исследования проводились без применения компь- 
ютеров, то есть создавалась реальная физическая модель, которая за- 
тем исследовалась, модифицировалась путем изменения позиций, до- 
бавления или удаления сегментов конструкции. 
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Первый компьютерный алгоритм ЭС был предложен в 1965 г. и 
затем усовершенствован в 1973 г. И. Риченбергом и имело достаточ- 
но простую форму, известную как бинарная или (1+1) - ЭС. В ней ис- 
пользовалось всего два объекта — родитель и потомок. Так же, как и в 
ГП отсутствовало различие между фенотипом и генотипом, каждый 
объект популяции представлялся как вектор вещественных чисел. 

Процесс генерации новых решений в таких ЭС состоял в приме- 
нении одного оператора мутации к случайно выбранному родителю. 
Мутация применялась независимо к каждому члену популяции по 
нормальному закону распределения случайной величины с нулевым 
математическим ожиданием и с предопределенным значением сред- 
неквадратичного отклонения. Далее определялся уровень приспособ- 
ленности потомка, и если он был выше, чем у соответствующего ро- 
дителя, то потомок попадал в следующее поколение в качестве роди- 
теля, в противном случае он исключался и операция мутации повто- 
рялась к его родителю с целью получения нового потомка. Этот вари- 
ант ЭС имел ряд недостатков, вызванных двухточечной схемой рабо- 
ты, наиболее существенными из которых является медленная ско- 
рость нахождения решения. 

Дальнейшее совершенствование этой технологии эволюционно- 
го моделирования связано с разработкой в начале 1980-х годов ЭС, 
использующих идею популяции решений. Они получили название 
(0+4) – ЭСи (м4) - ЭС, где и определяет число родителей; 4 - чис- 
ЛО ПОТОМКОВ. 

В (0+2) – ЭС и родителей порождает Я потомков, среди об- 
щего числа которых происходит отбор и лучших особей в следующее 
поколение. В (м4) – ЭС в отборе участвуют только сгенерированные 
потоки, поэтому для сохранения численности популяции и выполне- 
ния условия 4 > и рекомендуется использовать соотношение роди- 
тель : потоки как 1:7. Наряду с оператором мутации, в этих схемах 
ЭС применяется оператор рекомбинации, аналогичный кроссингове- 
ру в ГА. 

Ниже приводятся основные этапы эволюционных стратегий, ос- 
нованных на использовании популяций. 
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1. Создается и инициализируется начальная популяция, которая 
может быть сгенерирована случайно или создана посредством мута- 
ции единственного решения введенного пользователем. 

2. Для генерации потомков случайно выбираются родители из 
популяции родителей. 

3. До достижения заданного числа популяции потомков реали- 
зуется следующая последовательность действий: 

- на основе операторов рекомбинации определяется популяция 
потомков, при этом может быть использована информация об одном 
или о двух родителях подобно оператору кроссинговера в ГА для ка- 
ждого параметра решения; 

- генерируются новые решения на основе мутации, используя 
комбинации параметров ЭС. 

4. Определяется целевая функция найденных решений, лучшие 
потомки отбираются для популяции родителей, после обновления 
популяции родителей происходит случайный выбор последних для 
генерации новых потомков. 

5. Процесс останавливается, если найдены допустимые решения 
или выполнены условия останова. 


5.4. Эволюционное программирование 


Эволюционное программирование (ЭП) было разработано 
Л. Фогелем в 1960-х и во многом напоминает эволюционные страте- 
гии. Однако изначальная область применения ЭП была связана с син- 
тезом оптимальной структуры конечных автоматов, а именно: с ис- 
следованием динамики изменения таблиц переходов в пространстве 
конечных автоматов. Считается, что цель ЭП как эволюционной тех- 
нологии заключалась в организации процедуры создания машинного 
интеллекта. Под интеллектуальным поведением подразумевалась 
возможность прогнозирования диаграммы конечных состояний, пе- 
реводящих автомат к поставленной цели наиболее эффективным спо- 
собом. 
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В ЭП нет разделения между генотипом и фенотипом, а единст- 
венным эволюционным оператором является мутация, который при- 
меняется к единственной популяции решений. Позже в конце 1980-х 
годов были разработаны модификации ЭП, включающие стандартное 
ЭП, мета – ЭП (или просто ЭП) и Рмета – ЭП. Их отличие друг от 
друга состоит в использовании различных механизмов организации 
направленной мутации с целью повышения уровня самоадаптации и 
имитации эффекта от применения оператора кроссинговера. 

В качестве Нтез$-функции обычно используется некоторая мера 
близости между результирующим вектором значений конечного ав- 
томата и эталонной последовательностью символов. 

Процесс функционирования ЭП состоит из следующих этапов. 

1.Создается и инициализируется популяция на основе случайно 
сгенерированных особей или их случайно мутированных версий. 

2. Определяется целевая функция всех элементов популяции. 

3. До тех пор пока популяция не увеличится в два раза, реализу- 
ется следующая последовательность действий: 

- выбирается родитель методом турнирной селекции из случай- 
но сгенерированных групп; 

- генерируется потомок посредством мутации копии родителя. 

4. Определяется значение ћіпеѕѕ-функции потомков для их оцен- 
Ки. 

5. Удаляется половина популяции с наименьшими значениями 
бќпеѕѕ-функции. 

6. Процесс останавливается, если найдены допустимые решения 
или выполнены условия останова. 

В настоящее время попытки применения ЭА при решении при- 
кладных задач охватывают не только класс традиционных задач оп- 
тимизации, но и распространяются на другие направления искусст- 
венного интеллекта, например управление сложными динамическими 
объектами в условиях неопределенности, принятие решений на осно- 
ве нечеткого многокритериального выбора и т.п. Подобные исследо- 
вания подразумевают под собой создание теоретических и практиче- 
ских основ для модификаций ЭА, подавляющее большинство среди 
которых концентрируется вокруг следующих направлений: 
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- интеграция с другими областями «мягкой» математики: ней- 
ронные сети, нечеткое моделирование; 

- применение в самоорганизующихся, адаптивных системах; 

- использование в качестве базового для моделирования систем 
искусственной жизни; 

- реализация на параллельных архитектурах. 


Контрольные вопросы 


1. В чем характерные особенности эволюционного моделирования 
как направление искусственного интеллекта? 

2. Какие существуют методы эволюционного моделирования? 

3. Что такое генетический алгоритм? Дайте определения основным 
терминам, используемым в ГА. 

4. Каковы способы представления информации в ГА? 

5. В чем заключаются основные операторы ГА? 

6. В чем состоит последовательность работы ГА? 

7. Каковы особенности выбора значений параметров ГА? 

8. Что такое генетическое программирование? 

9. Как применяются генетические операторы при синтезе компьютер- 
ных программ? 

10. В чем состоит последовательность работы процедуры генетиче- 
ского программирования? 

11. Что такое эволюционные стратегии и каковы их особенности? 
Опишите последовательность работы этого эволюционного 
алгоритма. 

12. Что такое эволюционное программирование и каковы его особен- 
ности? Опишите последовательность работы этого эволюционного 
алгоритма. 

13. Каковы перспективы развития методов эволюционного моделиро- 
вания? 
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ГЛАВА 6. РАЗРАБОТКА ЭКСПЕРТНЫХ СИСТЕМ 


Экспертные системы (ЭС) как самостоятельное направление в 
искусственном интеллекте сформировалось в конце 1970-х годов. На- 
чало истории развития ЭС связано с исследованиями по разработке 
ЭВМ пятого поколения, в котором основное внимание уделялось раз- 
витию «интеллектуальных способностей», позволяющих им опериро- 
вать не только данными, но и знаниями — подобно специалистам или 
экспертам при выработке умозаключений. 

Экспертные системы предназначены исключительно для реше- 
ния практических задач, поэтому они стали первыми интеллектуаль- 
ными системами, которые привлекли внимание потенциальных по- 
требителей продукции искусственного интеллекта. Наибольшее рас- 
пространение ЭС получили в таких областях, как производство, биз- 
нес, медицина, то есть там, где особенно часто возникает необходи- 
мость принятия решений. 


6.1. Основные понятия 


Экспертные системы можно определить как программу, которая 
на основе заложенных в ней знаний (опыта) эксперта может дать ин- 
теллектуальный совет или принять решение относительно некоторого 
вопроса в узкой предметной области, а также объяснить ход своих 
рассуждений понятным для пользователя образом [4, 10]. 

Обычно ЭС используются как инструмент для автоматизации 
работы эксперта. Кроме этого, ЭС может выступать в роли: 

- консультанта для неопытных или непрофессиональных поль- 
зователей; 

- ассистента эксперта-человека в процессах анализа вариантов 
решений; 

- партнера эксперта в процессе решения задач, требующих при- 
влечения знаний из разных предметных областей. 
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Следствием этого являются следующие преимущества от ис- 
пользования ЭС. 

1. Постоянство. Человеческая компетенция ослабевает со вре- 
менем. Перерыв в деятельности человека-эксперта может серьёзно 
отразиться на его профессиональных качествах. 

2. Легкость передачи или воспроизведения знаний. Передача 
знаний от одного человека к другому, как правило, долгий и дорогой 
процесс, в отличие от которого передача электронной информации 
представляет собой простой процесс копирования программы или 
файла данных. 

3. Устойчивость результатов. Эксперт-человек может принимать 
в тождественных ситуациях разные решения из-за эмоциональных 
факторов. Результаты ЭС -— всегда стабильны. 

4. Стоимость. Услуги экспертов, особенно высококвалифициро- 
ванных, очень дороги. В противоположность этому ЭС характеризу- 
ются дорогостоящей разработкой, но дешевой эксплуатацией. 

Главное отличие ЭС от традиционных систем обработки данных 
состоит в том, что в них преобладает символьный, а не числовой спо- 
соб представления данных, а в качестве методов обработки информа- 
ции применяются процедуры логического вывода и эвристического 
поиска решений (табл. 6.1). 

Таблица 6.1 


Отличия ЭС от обычных систем обработки данных 


Характеристика Разработка ЭС традиционное 
программирование 

Тип обработки Символьный Числовой 
Метод Эвристический поиск Точный алгоритм 
Задание шагов решения | Неявное Явное 
Искомое решение Удовлетворительное Оптимальное 
Управление и данные Смешаны Разделены 
Знания Неточные Точные 
Модификации Частые Редкие 


Кроме этого, в отличие от традиционной программы ЭС при 
решении задачи выполняет не только предписанную алгоритмом по- 
следовательность действий, но и сама предварительно формирует их. 
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Также ЭС имеет возможность самообучаться на решаемых задачах, 
автоматически дополняя базу знаний результатами полученных вы- 
водов и решений. 

В общем случае ЭС состоит из следующих основных компо- 
нент: базы знаний, рабочей памяти (базы данных), решателя (интер- 
претатора), системы объяснений, модуля приобретения знаний, ин- 
терфейса с пользователем (рис. 6.1) [10]. 


Приобретение 


знании 


Объяснение 


Рабочая память 
Решатель 


Рис. 6.1. Структура экспертной системы 


База знаний 
(правила, факты) 


Пользователь 


База знаний ЭС предназначена для хранения информации, опи- 
сывающей предметную область и обычно представляется в виде на- 
бора правил, а также ассоциированных с ними данных и процедур 
для их преобразования. 

База данных (рабочая память) служит для хранения текущих 
данных решаемой задачи. 

Решатель (интерпретатор) формирует последовательность при- 
менения правил и обрабатывает их, используя данные из рабочей па- 
мяти и знания из базы знаний. Наиболее простая реализация такого 
логического вывода соответствует продукционной форме представ- 
ления знаний и рассматривалась ранее. Однако для общего случая 
знания о предметной области характеризуются неопределенностью, 
которая может проявляться как в истинности самой посылки, так и в 
заключении. Поэтому в ЭС при описании знаний часто добавляется 
вероятностная мера, а решатель соответственно реализует связанные 
с этим расчеты для выработки заключения и его вероятностной оцен- 
ки. 

Система объяснений показывает, каким образом система полу- 
чила решения задачи и какие знания при этом использовались. Это 
облегчает тестирование ЭС и повышает доверие пользователя к 
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полученному результату. Благодаря объяснительному компоненту 
эксперт при тестировании ЭС локализует причины ее неудачной ра- 
боты, что позволяет эксперту целенаправленно модифицировать ста- 
рые и вводить новые знания. Результатом работы объяснительного 
компонента обычно является статистика по использованию из базы 
знаний правил и данных в процессе выполнения ЭС процедуры логи- 
ческого вывода. 

Модуль приобретения знаний необходим для заполнения ЭС 
знаниями в диалоге с пользователем-экспертом, а также для добавле- 
ния и модификации заложенных в систему знаний. 

Любая ЭС должна иметь по крайней мере два режима работы. В 
режиме приобретения знаний эксперт наполняет систему знаниями, 
обычно в виде совокупности данных и правил. В дальнейшем эти 
знания будут использоваться для самостоятельного решения ЭС задач 
из конкретной предметной области. В режиме консультаций пользо- 
ватель ЭС сообщает системе конкретные данные о решаемой задаче, 
на основе которых решатель формирует ответ пользователю, обычно 
в виде некоторого предположения. 


6.2. Принципы разработки экспертных систем 


Разработка ЭС выполняется группой людей, включающей экс- 
пертов, инженеров по знаниям и программистов. Инженер по знани- 
ям помогает эксперту выявить и структурировать знания, необходи- 
мые для работы ЭС, определяет способ представления знаний в ЭС. 
При наличии коллектива экспертов возникает проблема оценки не- 
противоречивости формулируемых ими суждений. В такой ситуации 
могут применяться известные способы экспертного оценивания (ме- 
тоды ранжирования, парных сравнений, непосредственной оценки) 
или выделяется среди экспертов один, отвечающий за непротиворе- 
чивость знаний [4]. На рис. 6.2 показано взаимодействие основных 
участников создания и эксплуатации ЭС. 
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Расширяет и 
проверяет 


Опрашивает 


Уточняет, тестирует Использует 


Инженер по Экспертная 
знаниям система 


Пользователь 


Добавляет 
информацию 


Программист Операторы 


Рис. 6.2. Взаимосвязи участников разработки и пользователей ЭС 


В этой схеме наиболее принципиальными являются такие объ- 
екты, как эксперт и инженер по знаниям. 

Эксперт — человек, способный ясно выражать свои мысли и 
пользующийся репутацией специалиста, умеющего находить пра- 
вильные решения проблем в конкретной предметной области. Экс- 
перт обладает особыми приемами, чтобы сделать поиск решения бо- 
лее эффективным. 

Инженер по знаниям -— человек, как правило, имеющий познания 
в информатике и искусственном интеллекте и знающий как строить 
ЭС. Инженер по знаниям опрашивает экспертов, систематизирует 
знания, решает, каким образом они должны быть представлены в ЭС. 

Перед тем как приступить к созданию ЭС, инженер по знаниям 
должен рассмотреть вопрос о целесообразности разработки ЭС для 
данной области. Положительное решение принимается, если отсутст- 
вуют традиционные вычислительные средства решения задачи, а 
также имеется возможность извлечь и эффективно формализовать 
экспертные знания. 

Условие возможности реализации ЭС можно сформулировать в 
виде следующих требований [1]: 

- существуют эксперты в данной области, которые решают зада- 
чу значительно лучше, чем начинающие специалисты; 

- эксперты сходятся в оценке предлагаемого решения, так как в 
противном случае будет невозможно оценить качество разработанной 
ЭС; 
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- эксперты способны вербализовать (выразить на естественном 
языке) и объяснить используемые ими методы; 

- решение задачи требует только рассуждений, а не действий; 

- задача не должна быть слишком трудной (то есть ее решение 
должно занимать у эксперта несколько часов, а не недель или лет); 

- задача, хотя и не должна быть выражена в формальном виде, 
все же должна относиться к достаточно «понятной» и структуриро- 
ванной области, то есть должна существовать возможность выделе- 
ния основный понятий, отношений и способов получения решения 
задачи; 

- решение задачи не должно в значительной степени опираться 
на «здравый смысл» (то есть широкий спектр общих сведений о мире 
и о способе его функционирования, которые знает и умеет использо- 
вать любой нормальный человек), так как подобные знания пока не 
представляется возможным в достаточном количестве заложить в ЭС. 

В основе технологии разработки ЭС лежат шесть основных эта- 
пов (рис. 6.3), включающих идентификацию, концептуализацию, фор- 
мализацию, выполнение, тестирование и опытную эксплуатацию [10]. 


Тестирование 


Завершение 


Начало 


Идентификация 


Требования 


Опытная 
эксплуатация 
Выполнение 


Структуры 
знаний 


Изменение 


Усовершен- 


ствование 
Концептуализация 
Формализация 


Рис. 6.3. Этапы разработки экспертных систем 


Понятия 


На этапе идентификации определяются задачи, подлежащие 
решению, цели разработки, эксперты и типы пользователей. 

На этапе концептуализации проводится содержательный ана- 
лиз предметной области, выявляются используемые понятия и их 
взаимосвязи, определяются методы решения задач. Для определения 
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основных понятий предметной области могут быть использованы 
методы, основанные на различных психологических эффектах. Так, в 
методе «составление оглавления учебника» эксперту предлагается 
представить ситуацию, в которой его попросили написать учебник. 
Необходимо составить на бумаге перечень предполагаемых глав, раз- 
делов, параграфов, пунктов и подпунктов книги. Другой - «текстоло- 
гический метод» формирования системы понятий - заключается в 
том, что эксперту дается задание выписать из руководств (книг по 
специальности) некоторые элементы, представляющие собой едини- 
цы смысловой информации. 

Эффективность выполнения этих этапов во многом определяет- 
ся успешным формированием авторитетной группы экспертов и по- 
лучением от них качественных знаний. 

На этапе формализации выбираются инструментальные сред- 
ства и способы представления всех видов знаний, формализуются ос- 
новные понятия, определяются способы интерпретации знаний. 

На этапе выполнения осуществляется заполнение базы знаний. 
Поскольку основу ЭС составляют именно знания, то данный этап яв- 
ляется наиболее важным и трудоемким. На данном этапе происходит 
занесение в ЭС предварительно формализованных в «понятном» сис- 
теме знаний экспертов, а также возможно создание одного несколь- 
ких опытных прототипов экспертной системы. 

На этапе тестирования эксперт и инженер по знаниям в инте- 
рактивном режиме проверяют компетентность ЭС. Процесс тестиро- 
вания продолжается до тех пор, пока эксперт не решит, что система 
достигла требуемого уровня компетентности. 

На этапе опытной эксплуатации проверяется пригодность ЭС 
для передачи конечным пользователям. Полученные результаты мо- 
гут показать необходимость в существенной модификации ЭС. 

Как и разработка любого программного обеспечения, процесс 
создания ЭС не сводится к строгой последовательности перечислен- 
ных этапов. В ходе разработки возникает потребность неоднократно 
возвращаться на более ранние этапы и пересматривать принятые там 
решения. 
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6.3. Классификация экспертных систем 


В зависимости от своих функциональных свойств экспертные 
системы принято классифицировать по следующим признакам [1]: 

- способу формирования решения; 

- способу учета временного признака; 

- виду используемых данных и знаний; 

- числу используемых источников знаний. 

По способу формирования решения ЭС можно разделить на 
анализирующие и синтезирующие. В системах первого типа выбира- 
ется решение из множества известных решений на основе анализа 
знаний, в системах второго типа решение синтезируется из отдель- 
ных фрагментов знаний. 

В зависимости от способа учета временного признака ЭС делят 
на статические и динамические. Большинство ЭС являются статиче- 
скими, в них не учитываются изменения в окружающем мире за вре- 
мя решения задачи. Однако существует класс задач, где выполнения 
этого требования является обязательным. Такие ЭС относятся к ди- 
намическим, их связь с реальным миром осуществляется через систе- 
му контроллеров и датчиков. Следствием этого является существен- 
ное изменение в механизмах логического вывода для адекватного от- 
ражения временной логики происходящих в реальном мире событий. 

По видам используемых данных и знаний различают ЭС с де- 
терминированными и неопределенными знаниями. ЭС могут созда- 
ваться с использованием одного или нескольких источников знаний. 

В соответствии с перечисленными признаками можно выделить 
четыре основных класса ЭС (рис. 6.4): классифицирующие, доопре- 
деляющие, трансформирующие и мультиагентные [1]. 

Классифицирующие ЭС предназначены для решения задач рас- 
познавания ситуаций. Основным методом формирования решений в 
таких системах является дедуктивный логический вывод. 

Доопределяющие ЭС используются для решения задач с не пол- 
ностью определенными данными и знаниями. 
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Анализ Синтез 


Детермини- 


В Классифици- Трансформи- Один источник 
рованность знаний 
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Доопределяю- 
щие источников знаний 


Неопределенность Мультиагентные Несколько 


знаний 


Статика Динамика 
Рис. 6.4. Основные классы экспертных систем 


Трансформирующие ЭС относятся к синтезирующим эксперт- 
ным системам, в которых предполагается повторяющееся преобразо- 
вание знаний в процессе решения задач. 

Мультиагентные ЭС представляют собой системы, основанные 
на интеграции нескольких разнородных источников знаний, которые 
обмениваются между собой получаемыми результатами в процессе 
решения задачи. 

Однако такое многообразие ЭС появилось не сразу, а стало ре- 
зультатом эволюции из ряда поколений, на каждом из которых они 
предназначались для решения исключительно специфических для 
данного поколения задач. Процесс развития технологий ЭС условно 
можно разделить на три поколения. 

Экспертные системы первого поколения в основном содер- 
жали исследовательские прототипы для исследования и обоснования 
теоретических основ искусственного интеллекта. Проводившиеся в 
этот период исследования носили фундаментальный характер, на- 
правленный на исследование отдельных фрагментов приобретения, 
представления и использования знаний, различных механизмов вы- 
вода. 

Практическое использование ЭС носило исключительно кон- 
сультирующий характер, то есть они представляли собой системы с 
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интеллектом пассивного ассистента пользователя. Они располагали 
только теми знаниями, которые были получены от экспертов, перера- 
ботаны «инженерами знаний» и введены в базу знаний в «удобном» 
для машины виде. ЭС была способна манипулировать этими знания- 
ми, имитируя процесс логического вывода, и выдавать ответы на за- 
просы пользователя. Система не имела механизмов, которые позво- 
ляли бы ей критически оценивать вводимые в ее память знания, вы- 
являть в них противоречия, автоматически обнаруживать закономер- 
ности, использовать их для предсказания и извлекать новые знания из 
данных. Дальнейшее развитие ЭС первого поколения было связано с 
использованием в них нечетких выводов. 

Основным отличием экспертных систем второго поколения 
от ЭС первого поколения является их интегрированность. На основе 
объединения с традиционными информационными технологиями они 
становятся гибридными системами (интеллектуальными комплексами 
моделирования). Гибридные ЭС определяются как объединение паке- 
тов прикладных программ и сложных расчетно - логических систем с 
традиционными ЭС в основном продукционного типа. Подобные ЭС 
должны решать проблему сочетания двух видов информации: коли- 
чественных моделей точных наук и качественного опыта применения 
таких моделей в конкретных ситуациях. При этом точные модели из- 
бавляются от разного рода неформальных надстроек, а ЭС – от не- 
свойственных им количественных зависимостей. 

Таким образом, направление гибридных ЭС предполагает объе- 
динение процедурных методов моделирования с недетерминирован- 
ными методами вывода, используемыми в технологии ЭС. Создание 
таких систем привело к разработке нового подхода к математическо- 
му моделированию, позволяющему проводить качественное модели- 
рование с использованием информации в виде фактов и правил. Та- 
кие комплексы включают расчетный (имитационный) компонент, 
обеспечивающий количественные решения, и эвристический (логиче- 
ский) компонент, позволяющий успешно решать качественные 
задачи. 
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При применении гибридных ЭС при автоматизации задач про- 
ектирования, кроме отмеченных ранее функций, обеспечиваются: 

- генерация новых фактов и знаний путем логического вывода из 
имеющегося набора правил и фактов; 

- реализация различных схем решения задач, отличающихся по- 
следовательностью использования типовых для системы методов; 

- возможность обоснования решений на основе многокритери- 
ального анализа, планирования вычислений, логического вывода, оп- 
тимизации. 

Главное направление происходящих в настоящее время смен 
концепций создания ЭС и использования средств искусственного ин- 
теллекта — это переход от предположений, справедливых только для 
изолированных систем искусственного интеллекта, и от индивиду- 
альных, автономных систем к распределенной обработке информации 
и разработке многоагентных интеллектуальных систем - перспек- 
тивных экспертных систем. Основой для создания подобных ЭС 
являются результаты, имеющиеся в области методов обнаружения за- 
кономерностей, распознавания образов, структурно — логического 
анализа данных и знаний. 

Основной отличительной функцией ЭС является умение давать 
правильные предсказания, рекомендации на основе обработки посту- 
пающих данных и выявления устойчивых (закономерных) связей ме- 
жду характеристиками данных. 

Данные системы обладают средствами самостоятельного извле- 
чения знаний из данных, поступающих в систему в ходе ее создания и 
эксплуатации. Это дает возможность ЭС обнаруживать противоречия 
между имеющимися и вновь поступающими знаниями и данными 
(проверка адекватности базы знаний). Подобные возможности позво- 
ляют рассматривать данный класс ЭС как «активные» экспертные 
системы, выполняющие роль активного помощника пользователя 
(советующие системы). 

Эволюция функциональных усовершенствований ЭС различных 
поколений, а также их характеристики представлены в табл. 6.2. 
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Таблица 6.2 
Характеристики экспертных систем 
Основные ЭС первого ЭС второго Перспективные 
характеристики поколения поколения ЭС 
«Инженер знаний», Автоматическое 
Способы извле- 


чения знаний, 


«Инженер зна- 
ний», эмпири- 


исследования по 


обнаружение из баз 


автоматическому | знаний (из текстов, 
структура баз зна- | ческие знания Б 
13 извлечению знаний | руководств, схем и 
НИЙ эксперта а 
из базы знаний т.д.) 
Отдельные 


Типы баз знаний 


формы: продук- 
ция, фреймы, 
семантические 
сети, решающие 
деревья 


Работа с любыми 
формами знаний 
(включая инженер- 
ные знания) 


Библиотека форм 
знаний, имитацион- 
ные модели, сцена- 

рии 


Источник знаний 


Эксперт 


Эксперты, базы 
знаний 


Базы знаний, дан- 
ные, статистические 
или эмпирические 
таблицы вида «объ- 
ект - свойство - вре- 
мя» 


Наличие базы дан- 
ных 


Отсутствует 


Частично, базы 
данных из таблиц 
вида «объект — 
свойство» 


Базы данных из 
таблиц вида «объ- 
ект - свойство — 
время» 


Логический вывод 


Вывод по де- 
дукции 


Дедукция, нечет- 

кие выводы, ин- 

дукция, немоно- 
тонные рассужде- 
ния, частично рас- 
суждения по ана- 


Дедукция, индук- 
ция, немонотонные 
рассуждения, мето- 
ды близости в про- 

странстве знаний, 

рассуждения по 


логии аналогии 
Фразы и терми- Сценарии диалога, 
ны жесткой Проблемно- ормирование тер- 
Язык общения с р У Сормир р 
конструкции ориентированный | минологии под при- 
пользователем Г ы 
прикладной об- | естественный язык | кладную область и 
ласти форм сообщений 
Словари по опреде- 
ляющим терминам 
г Ограниченный сло- | прикладных облас- 
Устный диалог Отсутствует 


варь 


тей в процессе об- 
щения и использо- 


вания 
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Продолжение табл. 6.2 


Основные ЭС первого ЭС второго 
Перспективные ЭС 
характеристики поколения поколения 
Частичная Проверка непроти- 
проверка непроти- | воречивости, полно- 
Проверка адекват- 
й Отсутствует воречивости и ты, работа с инфор- 
ности баз знаний Й 
полноты баз зна- | мацией с НЕ – фак- 
НИЙ торами 
Исследования по 
Автоматическое 
Прогнозирование автоматическому 
прогнозирование 
недостающих прогнозированию 
Отсутствует величин, отсутст- 
данных в базе величин, отсутст- 
вующих в базе дан- 
данных вующих в базе 
НЫХ 
данных 
Программы адапта- 
Обучение систем рогр 
ции под конкретных 
Модель по адаптации под С 
Отсутствует пользователей и ин- 
пользователя конкретного поль- с 
терфейс с система- 
зователя 
ми проектирования 
Числовые данные, 
Числовые данные, 
рекомендации с со- 
рекомендации с 
Числовые дан- провождающим по- 
сопровождающим 
Выдаваемые ные, стандарт- яснением, формули- 
езультаты ные рекоменда А ование обнаружен 
резу. р чение систем об- | Р РУ 
ЦИИ ных новых законо- 
наружению новых ы 
. | мерностей, тенден- 
закономерностей б 
ций, диаграммы 
Вид обрабатывае- инамическая Статическая, дина- 
ор Статическая Д " да 
мой информации статическая мическая, потоковая 
Гибридные интел- 
лектуальные нечет- 
Гибридное по- 
Обособленное кие системы (интел- 
Принцип построе- строение ЭС (эв- 
использование лектуальные интег- 
ния и использова- ристическая и 
ЭС для решения рированные ком- 
ния системы имитационная 
задачи плексы моделиро- 
компоненты) 
вания), открытая 
система 
Распределение ЭС, 
Исследования по 
Обработка распре- многоагентные сис- 
Е Отсутствует построению рас- 
деленных знаний темы искусственно- 
пределенных ЭС 
го интеллекта 
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Окончание табл. 6.2 


Основные ЭС первого ЭС второго 


Перспективные ЭС 
характеристики поколения поколения 


Активный помощ- | Комплексная ком- 


5 ник пользователя, | пьютеризация дея- 
Пассивный по- 


Функции моделирование тельности, актив- 
мощник пользо- С 
системы процессов инже- НЫЙ 
вателя $ 
нерной деятельно- | помощник пользо- 
сти вателя 
Ввод новых В рабочем режиме 


В рабочем режиме 
экспертной системы 


К В режиме ввода е 
знаний, модифи- экспертной систе- 
информации 


кация знаний мы 


6.4. Пример экспертной системы 


В качестве примера рассмотрим процедуру создания ЭС в об- 
ласти медицинской диагностики. Подобные ЭС имеют большую 
практическую ценность, потому что позволяют работать (определять 
диагноз) в условиях неполной информации, то есть, в отличие, на- 
пример от медицинской энциклопедии, где по каждому заболеванию 
можно найти абсолютно полный набор точных симптомов, ЭС позво- 
ляет решить обратную задачу, а именно: определение болезни по 
предъявляемым ей симптомам. В этом случае приходится сталкивать- 
ся с неопределенностью представляемой информации, так как в очень 
редких случаях отдельные симптомы однозначно характеризуют бо- 
лезнь (например, высокая температура далеко не всегда связана с та- 
ким заболеванием как грипп). Для управления такой неопределенно- 
стью, свойственным многим прикладным областям, в ЭС часто ис- 
пользуют вероятностную модель на основе теоремы Байеса [4, 10]. 

В основе этой теоремы лежит понятия условной вероятности 
Р(А|В) = х, которое означает, что при условии наступления события В 
(и всего остального, что не имеет отношения к 4) вероятность воз- 
никновения А равна х. Пусть имеется условная вероятность Р(А|В) 
наступления некоторого события А при условии, что наступило собы- 
тие В. Теорема Байеса позволяет решить обратную задачу — 


178 


определить вероятность наступления более раннего события В, если 
известно, что более позднее событие А наступило. 
род ву РФР) 
Р(В) 

Здесь Р(В|А) называют правдоподобием, а знаменатель Р(В) - 
свидетельством. 

Эффект применения данной теоремы в ЭС состоит в том, что, 
изучая следствие, можно определить вероятность причины. В этом 
случае знания в ЭС будут представляться в форме: «Если Н является 
истиной, то ЕЁ будет наблюдаться с вероятностью Р», 

где Н – событие, заключающееся в том, что данная гипотеза 
верна; 

Е – событие, заключающееся в том, что наступило определенное 
доказательство (свидетельство), которое может подтвердить правиль- 
ность указанной гипотезы. 

Таким образом, разрабатываемая ЭС будет определять вероят- 
ность наличия у больного заболевания при подтверждении или опро- 
вержении им некоторой группы симптомов. Для простоты будем 
предполагать, что ЭС должна определять только такие болезни, как 
грипп и отравление. Основные симптомы этих заболеваний приведе- 
ны в табл. 6.3. 


Таблица 6.3 
Основные симптомы 

№ Симптом 

1 Высокая температура 

2 Боль в животе 

3 Кашель 

4 Тошнота 

5 Головная боль 


Далее необходимо связать болезни и их симптомы, а именно: 
создать базу знаний ЭС. Этот этап должен выполняться непосредст- 
венно экспертами, именно от точности формализации их знаний бу- 
дет зависеть качество работы ЭС. В табл. 6.4 приведен фрагмент базы 
знаний примера. 
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Таблица 6.4 
База знаний примера 


= 


(Н) Р(Н) |}, РЕН), РЕН)] 


(1, 0.7, 0.01) 


(2, 0.01, 0.5) 


Грипп 0.01 (3, 0.7, 0.3) 


(4, 0.1, 0.5) 


(5, 0.8, 0.1) 


(1, 0.4, 0.5) 


(2, 0.7, 0.1) 


Отравление 0.01 (3, 0.01, 0.5) 


О мыши 


(4, 0.8, 0.1) 


— 
© 


(5, 0.6, 0.2) 


Здесь поле Н характеризует название возможного заболевания, 
например «Грипп». Следующее поле Р(Н) определяет априорную ве- 
роятность этого заболевания при отсутствии дополнительной инфор- 
мации. Для нашего случая Р(Н) = 0,01, что означает ситуацию, когда 
любой наугад взятый человек болеет гриппом. Значения последнего 
столбца состоят из трех элементов. Первый определяет номер сим- 
птома. Следующие два соответственно вероятности получения отве- 
та «Да» на этот вопрос, в случае возможности или невозможности за- 
ключения. Так, для первого симптома Р(ЕН) = 0.7, РЕН) = 0,01, 
это означает, что если у пациента грипп, то он в семи случаях из де- 
сяти ответит «Да» на этот симптом, а если у него нет гриппа, то он 
ответит утвердительно лишь в одном случае из ста. Положительный 
ответ подтверждает гипотезы о том, что у него грипп, отрицательный 
ответ опровергает это заболевание. Для второго симптома Р(ЕН) = 
0,01, следовательно, вероятность его появления у больного гриппом 
очень мала. В целом в зависимости от болезни каждый симптом мо- 
жет проявлять себя по-разному. Кроме этого, в качестве симптомов 
могут указываться вопросы, например «Наблюдаете ли вы такой сим- 
птом на протяжении большей части жизни ?». 

Таким образом, при формировании базы знаний некоторой при- 
кладной области экспертами должны быть сформулированы следую- 
щие вероятности: 

- априорные вероятности всех возможных гипотез (Р(Н)); 
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- условные вероятности возникновения свидетельств, при усло- 
вии существования каждой из гипотез (Р(Е|Н)). 

При этом условные вероятности должны быть получены для 
всех свидетельств и заключений, предполагая, что все свидетельства 
независимы в рамках одного заключения. 

Все это свидетельствует о необходимости проведения исследо- 
ваний перед назначением соответствующих вероятностей при фор- 
мировании базы знаний ЭС. Для повышения качества экспертных 
оценок могут быть использованы специальные методы определения 
коэффициентов уверенности и доверия. 

Перед началом работы с ЭС рекомендуется определить степень 
важности имеющихся симптомов по следующей формуле: 

п == 
К, = РСЕ) РСЕ), 
= 

После ранжирования симптомов по значению Ау ЭС может ра- 
ботать в режиме консультаций, при этом вопросы пользователю за- 
даются, начиная с наиболее важного симптома. На вопросы ЭС поль- 
зователь отвечает «Да» или «Нет» (значения 1 или 0 соответственно), 
определяя наличие симптома. 

Каждый раз после поступления новой информации от пользова- 
теля априорные вероятности гипотез новыми значениями. Для этого 
используется правило Байеса, являющееся следствием теоремы. 

ыНЕ- Р(Е|Н)Р(Н) 
Р(Е|Н)Р(Н) + Р(Е|Н)Р(Н) 

Вероятность подтверждения некоторой гипотезы Н при наличии 
определенных подтверждающих свидетельств Ё вычисляется на ос- 
нове априорной вероятности этой гипотезы без подтверждающих 
свидетельств и вероятности осуществления свидетельств при услови- 
ях, что гипотеза верна или неверна. 

Приведенная формула используется для корректировки вероят- 
ности гипотезы при положительном ответе пользователя на вопрос. 
При отрицательном ответе данная зависимость принимает вид 

м 1-Р(Е|Н)Р(Н) 
1 - Р(Е[Н))Р(Н) +(1- Р(ЕТН))Р(Н)] 
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Имеющиеся заключения упорядочиваются по убыванию значе- 
ний Р(Н). Заключение с максимальной вероятностью принимается в 
качестве результата работы экспертной системы. 

Следуя примеру, предположим, что ЭС нужно выполнить диаг- 
ностику заболевания гриппом. Тогда значения вероятностей обеих 
болезней в процессе консультации с ЭС будут изменяться следую- 
щим образом (табл. 6.5). Симптомы ранжированы в соответствии со 
степенью их важности. 


Таблица 6.5 
Результаты работы ЭС 

Симптом Ответ Р(Грипп) Р(Отравление) 
Головная боль Да 0,074 0,029 
Тошнота Нет 0,125 0,006 
Высокая температура Да 0,9 0,005 
Боль в животе Нет 0,94 0,0017 
Кашель Да 0,97 0,0003 


Как видно из табл. 6.5, после получения ответов на все вопросы, 
ЭС полностью подтвердила с высокой вероятностью изначально 
предполагаемый диагноз гриппа у пациента. 

Рассмотренная ЭС является достаточно простой и имеет целый 
ряд допущений, главное из которых состоит в предположении об аб- 
солютной достоверности получаемых от пользователя ответов (Да, 
Нет). Однако чаще всего в таких случаях информация носит много- 
значный, неточный характер («Может быть», «Скорее да, чем нет» и 
т.п.), что требует применения в ЭС более сложных механизмов логи- 
ческого вывода, например на базе математических основ теории не- 
четких множеств. 

Кроме этого, при организации на основе вероятностной модели 
приходится сталкиваться с необходимостью получения огромного 
числа вероятностей, образующих базу знаний. Так, если некоторая 
медицинская область имеет 100 диагнозов и 700 симптомов, то уже в 
этом случае должны быть получены 70100 значений вероятностей 
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(70000 условных и 100 априорных). Также необходимо учитывать 
требование независимости симптомов, что часто не соответствует 
действительности. 

Решением этой проблемы может служить применение байесов- 
ских сетей доверия, с помощью которых описываются информацион- 
ные потоки в предметных областях, характеризующихся наследован- 
ной неопределенностью. Было показано, что с помощью таких сетей 
можно создать согласованную и непротиворечивую базу знаний без 
необходимости в предположении условной независимости. 

Также следует отметить перспективность построения ЭС на ос- 
нове искусственных нейронных сетей. 


6.5. Разработка экспертных систем на основе 
байесовских сетей доверия 


Байесовские сети доверия применяются для описания знаний 
тех областей, которые характеризуются наследованной неопределен- 
ностью содержащихся в них причинно-следственных связей [7]. 

Сети Байеса представляют собой направленный граф без цик- 
лов, обладающий следующими свойствами: 

- каждая вершина представляет собой событие, описываемое 
случайной переменной, которая может иметь несколько состояний; 

- каждая перемененная может принимать одно из конечного 
множества взаимоисключающих значений; 

- каждой переменной-потомку А с переменными предками 
Вузы В: приписывается таблица условных вероятностей 
Р(А|В,,..., В,). 

- если переменная А не содержит предков на графе, то вместо 
условных вероятностей используются безусловные (априорные) ве- 
роятности Р(А). 

Таблица условных вероятностей каждой дочерней вершины со- 
держит вероятности состояний этой вершины, при условии возмож- 
ных состояний ее родительских вершин. 
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На рис. 6.5 показан пример простой байесовской сети. Здесь 
вершины 4, В, С соответствуют ситуации, когда А, В являются при- 
чиной для С. Важно, что при этом должно выполняться условие не- 
зависимости случайных переменных, соответствующих вершинам 
графа. Две вершины А и В являются условно независимыми при дан- 
ной третьей вершине С, если при известном значении С значение В 
не увеличивает информативность о значениях А: Р(С| А, В) = Р(СИ). 


Тогда вероятность пребывания вершины С в различных состояниях 
С; зависит от состояний 4; и В; вершин А, В и определяется как 


РСС,)= У/У,Р(С, |А,В,)Р(А,В,). 


Принимая во внимание тот факт, что А и В события условно не- 
зависимые, Р(4,В8;) = Р(А;):Р(В;). 


Рис. 6.5. Простейшая байесовская сеть 


В байесовских сетях вероятностная оценка может производиться 
в обоих направления на графе. Для этого используется теорема 
Байеса для случая влияния свидетельства Ё на множество несовмес- 
тимых, взаимоисключающих гипотез Н;, і = 1..т. 


2, Р(Е|Н,ӘР(Н,) 


Полученное значение Р(Н,|Е) называется апостериорной веро- 
ятностью гипотез Н; по свидетельству Е. 


В случае множества условно независимых свидетельств эта 
формула принимает вид 


РН. |ЕЕ,..Е,) = __(ЁЇНОР(Е, |Н.)...Р(Е,|Н)Р(Н) 
УРЕ |Н,)Р(Е,|Н,)..- РЕ, |Н,)Р(Н,) 
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Таким образом, введение в сеть новых свидетельств приводит к 
их распространению по графу, в результате каждому высказыванию, 
ассоциированному с вершинами графа, назначается вычисленная апо- 
стериорная вероятность, определяющая степень доверия к этому вы- 
сказыванию. 

В качестве примера предположим, что есть некоторый набор 
предположений относительно возможности потери деревьями в саду 
листвы: «листья часто опадают, если дерево засыхает из-за недостат- 
ка влаги или если дерево болеет». Эта ситуация может быть описана 
с помощью байесовской сети доверия (рис. 6.6), содержащей три 
вершины «Болеет», «Засохло» и «Облетело». При этом каждая вер- 
шина может иметь одно из двух возможных состояний 1/0 (да/нет). 


Болеет 


Засохло 


Облетело 


Рис. 6.6. Байесовская сеть примера 


Количественно данную сеть можно описать с помощью сле- 
дующих вероятностных правил. 

1. Р(Болеет = «да») = 0,1 

2. Р(Болеет = «нет») = 0,9 

3. Р(Засохло = «да») = 0,1 

4. Р(Засохло = «нет») = 0,9 

5. ЕСЛИ Болеет = «да» И Засохло = «да», ТО 

Р(Облетело = «да») = 0,95 

6. ЕСЛИ Болеет = «да» И Засохло = «да», ТО 

Р(Облетело = «нет») = 0,05 

7. ЕСЛИ Болеет = «нет» И Засохло = «да», ТО 

Р(Облетело = «да») = 0,85 

8. ЕСЛИ Болеет = «нет» И Засохло = «да», ТО 

Р(Облетело = «да») = 0,15 
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9. ЕСЛИ Болеет = «да» И Засохло = «нет», ТО 

Р(Облетело = «да») = 0,9 

10. ЕСЛИ Болеет = «да» И Засохло = «нет», ТО 

Р(Облетело = «нет») = 0,1 

11. ЕСЛИ Болеет = «нет» И Засохло = «нет», ТО 

Р(Облетело = «да») = 0,02 

12. ЕСЛИ Болеет = «нет» И Засохло = «нет», ТО 

Р(Облетело = «нет») = 0,98 

Вершины «Болеет», «Засохло» не имеют родительских вершин, 
поэтому для них записывают безусловные вероятности нахождения 
этих вершин в каждом из возможных состояний. Этому соответству- 
ют первые четыре правила. Остальные правила описывают вероятно- 
сти пребывания дочерней вершины «Облетело» в зависимости от со- 
стояний родительских вершин и представляются в виде таблиц ус- 
ловных вероятностей. 

Предположим, стало известно о том, что дерево засохло, то есть 
Р(Облетело = «да») = 1. Тогда, используя свойство обратного оцени- 
вания, можно определить вероятности влияния на это ситуаций, что 
дерево — болеет и дерево — засохло: Р(Болеет = «да» | Облетело = 
«да») = 0.49, Р(Засохло = «да» | Облетело = «да») = 0.47. 

Рассмотрим более сложный случай описания с помощью сети 
Байеса базы знаний, в которой можно выделить заболевания, сим- 
птомы, их проявления, а также факторы риска, влияющие на возник- 
новения заболеваний. На рис. 6.7 приведена структура такой сети, 
взаимоотношения между узлами которой соответствуют следующему 
набору медицинских знаний: 

- отдышка может быть из-за туберкулеза, рака легких или брон- 
хита, а также вследствие отсутствия перечисленных заболеваний или 
наличия более, чем одного; 

- визит в Азию повышает шансы туберкулеза; 

- курение является фактором риска как для рака легких, так и 
бронхита; 

- результаты рентгена, содержащие патологию, не позволяют 
однозначно диагностировать рак и туберкулез, так же как не под- 
тверждают факт наличия или отсутствия отдышки. 
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Посещение Азии | Курение 
міі 1.0011 |. зтокег 50.0 аи 
по уіѕії 99.0 рини поп зтокег 50.0 риш = 


Туберкулез __ Раклеких | 


ргезепё 1.04 ргеѕепїі 5.50 ргеѕепі 45.0 
арѕепі 94.5 арѕепі 55.0 


абѕепї 99.0 
Туберкулез или Рак УД 


тие 6.48 
газе 93.5 


Результаты рентгена Отдышка О Факторы риска 
абпогта! 11.0 ргеѕепі 43.6 О Заболевания 
потта! 89.0 арѕепі 56.4 О Симптомы 


Рис. 6.7. Структура сети Байеса для примера 


Вершина «Туберкулез или Рак» играет роль промежуточной пе- 
ременной, соответствующей дизъюнкции и означает наличие одной, 
двух болезней или их отсутствие. 

Данная сеть Байеса была построена в системе МЕТІСА фирмы 
М огзуз Ѕоймаге Согр. При задании начальных безусловных вероятно- 
стей предполагались следующие статистические данные о некоторой 
достаточно большой группе людей: 

- 1% людей посещал Азию; 

- 50% людей курит; 

- 1% имеет заболевание туберкулезом; 

- 5,5% имеют рак легких; 

- 45% страдают легкой или хронической формой бронхита; 

- 6,48% имеют туберкулез или рак легких; 

- у 11% результаты рентгена могут показать наличие 
патологии; 

- 43,6% страдают отдышкой. 

Теперь при обращении пациента и введении в сеть информации 
о его симптомах или свидетельств о факторах риска могут быть по- 
лучены заключения в виде вероятностных оценок возможных заболе- 
ваний, а также наличия сопутствующих им причин. Так, при 
подтверждении пациентом наличия у него отдышки значения в узлах 
сети изменятся следующим образом (рис. 6.8). 
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этокег 63.4 мани | 
поп зтокег 36.6 


Бронхит 


ргезегё 83.4 
абзегё 16.6 


м 103] || | 


по мі5й 99.0 
Туберкулез [_ Раклеких | 
ргеѕепі 1.88 ргезепё 10.3 
абзегё 98.1 абзегё 89.7 
Туберкулез или Рак 


ие 12.1 
газе 87.9 


Результаты рентгена Отдышка 
абпопта! 16.2 ргеѕепі верненеча тени О Заболевания 
арбѕепі Гы О Симптомы 


О Факторы риска 


погта! 83.8 


Рис. 6.8. Изменение значений в узлах сети после ввода новых данных 


Возникновение таких изменений, как отмечалось ранее, вызвано 
пересчетом вероятностей при прямом и обратном распространении 
новых значений по узлам сети, в частности: 

- вероятность заболевания бронхитом (доверия к этому диагно- 
зу) увеличилась с 45 до 83,4%; 

- шансы, что пациент при этом курит увеличились с 50 до 
63,4%; 

- вероятность наличия патологий по результатам рентгена уве- 
личилась, но незначительно с 11 до 16%. 

Продолжая опрашивать пациента и одновременно корректируя 
на основе его свидетельств значения в узлах сети будут в разной сте- 
пени изменяться вероятности диагнозов. Так, при подтверждении 
фактов посещения Азии, а также курения, но при наличии результа- 
тов рентгена без патологий вероятности диагнозов изменятся сле- 
дующим образом: бронхит — 92%, туберкулез — 0,02%, рак легких — 
0,39%. Итогом является возможность с большой долей уверенности 
констатировать диагноз и назначить пациенту соответствующее ле- 
чение. 

Благодаря своим свойствам байесовские сети доверия широко 
применяются не только в таких областях, как медицина, но и при 
стратегическом планировании, в финансах и экономике. 
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Развитием сетей Байеса является создание на их основе диа- 
грамм влияния для принятия решений. Конструктивно это реализо- 
вывается за счет добавления к уже рассмотренным вершинам шансов 
новых типов вершин: узлов полезности, обозначаемых в виде ромбов 
и узлов решения, обозначаемых прямоугольниками (рис. 6.9) 


Т 


Рис. 6.9 Новые типы узлов сети Байеса 


Указания, содержащиеся в узлах решения, указывают на вре- 
менные причинно-следственные связи: 

- стрелка, идущая от случайной переменной к переменной ре- 
шения, указывает, что значение этой переменной станет известно, ко- 
гда будет принято решение; 

- стрелка, идущая от одной переменной решения к другой, от- 
ражает хронологическую последовательность соответствующих ре- 
шений. 

Важно, что сеть должна быть без циклов и содержать путь, про- 
ходящий через все узлы решения. 

При создании диаграмм ставится цель поиска оптимального ре- 
шения. Для этого с каждым состоянием сети связывается узел полез- 
ности, который характеризуется функцией полезности. Эта функция 
отражает ценность принятого решения в зависимости от состояний 
узлов-родителей. Узлы полезности не имеют потомков. Принятое 
решение оказывает влияние на значение вероятностей состояний уз- 
лов, поэтому можно вычислить ожидаемую ценность каждого из аль- 
тернативных решений. Затем из предложенных решений выбрать 
решение с максимальной полезностью. Диаграмма влияния может 
содержать несколько вершин полезности. В этом случае полная 
функция полезности вычисляется как сумма отдельных функций. 

В качестве примера рассмотрим простую ситуацию принятия 
решения о необходимости брать с собой зонт, выходя из дому, осно- 
вываясь на информации о прогнозе погоды. Диаграмма влияния для 
этой задачи приведена на рис. 6.10. 
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по тат 91.6 
гам 8.41 


зуппу 100 мии 


суду 0 
гату 0 


Решение брать зонт 


{аКе ії 24.2056 
Іеаүе аі Һоте 91.5887 


Рис. 6.10. Структура диаграммы влияния для примера 


Оправданность принятого реш-я 


Диаграмма имеет два узла шансов. Первый представляет воз- 
можный прогноз погоды утром: ѕиппу (солнечно), сІоџӣу (облачно), 
гаіппо (дождливо). Второй - вероятность дождя в течение дня. Также 
имеется узел решения (брать (ќаке 10) или не брать (Іеауе аё һоте) 
зонт) и узел полезности, позволяющий количественно оценить оправ- 
данность принятого решения. 

Из анализа связей между узлами видно, что вершина «Прогноз 
погоды» имеет стрелку в вершине «Решение брать зонт», тем самым 
предполагая, что человек будет знать прогноз погоды перед приняти- 
ем решения. Однако между узлами «Погода» и «Решение брать зонт» 
связь отсутствует, что вполне оправдано, так как, зная погоду в тече- 
ние дня, решение о необходимости брать зонт будет очевидным В 
свою очередь, стрелки от вершин «Погода» и «Решение брать зонт» 
к вершине «Оправданность принятого решения» определяют сле- 
дующие отношения между узлами: 

- ЕСЛИ «нет дождя» и «не взял зонт», ТО 

Оправданность решения = 100; 
- ЕСЛИ «есть дождь» и «взял зонт», ТО Оправданность решения = 70; 
- ЕСЛИ «нет дождя» и «взял зонт», ТО Оправданность решения = 20; 
- ЕСЛИ «есть дождь» и «не взял зонт», ТО 

Оправданность решения = 0; 

Предположим, что по прогнозу погоды будет солнечно. Тогда, 
подтвердив в узле «Прогноз погоды» событие «солнечно», значения в 
узлах сети изменятся следующим образом (рис. 6.10). Согласно узлу 
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«Погода», вероятность дождя составит 8,41%, и зонт имеет смысл ос- 
тавить дома, так как в узле полезности значение оправданности тако- 
го решения равно 91,58. 

В заключение отметим наиболее известные классические экс- 
пертные системы, имеющие опыт практического применения, а также 
современные средства разработки ЭС: 

- МСТМ – экспертная система для медицинской диагностики, 
разработанная группой исследователей по инфекционным заболева- 
ниям Стенфордского университета; 

- РОЕЕ – экспертная система, являющаяся модификацией МІСІМ 
для диагностики легочный заболеваний; 

- РЕХОКАГ, — экспертная система для распознавания химиче- 
ских структур по данным спектрометрии вещества; 

- РКОЅРЕСТОК - экспертная система, предназначенная для под- 
держки поиска месторождений полезных ископаемых. 

- МЕТСА - система разработки ЭС на основе байесовских сетей 
доверия, позволяющая создавать и редактировать причинно- 
следственные связи, заполнять таблицы условных вероятностей, а 
также проводить расчеты для принятия решений по всем событиям, 
входящим в сеть. 


Контрольные вопросы 


. Что такое экспертная система и каково ее назначение? 

. Какие основные понятия связаны с экспертными системами? 

. Какие типы задач решаются с применением ЭС? 

. Какие компоненты образуют структуру ЭС? 

. Каковы условия возможности реализации ЭС? 

. Какие особенности свойственны участникам разработки ЭС? 

. Каковы этапы разработки ЭС? 

. Какие существуют основные классы ЭС? Охарактеризуйте поколе- 
ния их развития. 

9. Каковы принципы создания ЭС на основе вероятностной модели? 
10. Расскажите как используется теорема Байеса для управления не- 
определенностью и логическим выводом в ЭС. 

11. Каковы особенности разработки и принципы работы Байесовских 
сетей доверия? Приведите примеры задач, где сети Байеса могут быть 
эффективно использованы. 

12. Что такое диаграммы влияния и каковы особенности их создания? 


со 1 м м ФФ Мм -— 
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ЗАКЛЮЧЕНИЕ 


Компьютерные системы являются неотъемлемой частью в рабо- 
те любой организации, помогая человеку справляться с решением са- 
мых разных задач. В то же время эффективность таких систем во 
многом зависит от используемых в них технологий представления и 
обработки информации, дальнейшее повышение качественного уров- 
ня которых связано не с увеличением вычислительных возможностей 
ЭВМ, а с наделением информационных систем интеллектуальными 
способностями на основе новых информационных технологий. 

Согласно Норберту Винеру, наиболее перспективные научные 
исследования находятся в так называемых пограничных областях, ко- 
торые нельзя точно отнести к той или иной дисциплине. Именно та- 
кое научное направление образует искусственный интеллект. 

В последнее время на основе методов искусственного интеллек- 
та происходит создание новых технологий обработки информации, 
включающих синтез и анализ естественного языка, управление зна- 
ниями, моделирование естественный процессов обучения и адапта- 
ции, координирование процессов принятия решений, планирования 
действий и т.д. Реализация этого в интеллектуальных компьютерных 
системах позволяет устранить многие ограничения в решении реаль- 
ных задач производства, экономики, социальной сферы, от которых 
зависит национальная конкурентоспособность. Понимание этого, а 
также необходимость в стимулировании развития этого направления 
информатики послужило причиной внесения искусственного интел- 
лекта в перечень критических технологий Российской Федерации. 
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